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S31 数学 地 质 学 的 发 展 简 史 


数学 地 质 学 是 采用 数学 理论 和 方法 ,以 计算 机 为 主要 技术 手段 ,定量 化 、 管 能 化 .可视化 
地 研究 地 质 过 程 中 所 产生 的 地 质 现 象 和 资源 状况 的 一 门 地 质 学 边缘 学 科 。 

1840 年 至 1935 年 ,是 数学 在 地 质 学 中 初步 应 用 和 在 个 别 方面 进行 少量 分 散 研 究 的 时 
期 。1840 年 莱 伊 尔 利 用 古生物 化 石 的 统计 分 析 对 第 三 系 进行 划分 。1890 年 皮尔 逊 (Karl 
Pearson) 编 写 了 《数学 进化 论 贡献 ?丛书 ,内 有 古生物 化 石 的 统计 分 析 。1914 年 至 1934 年 ， 
列 文生 - 列 星 格 (JIepracoH-JIeccaar) 通 过 考察 岩石 岩浆 系数 的 频率 分 布 , 研 究 了 安山岩 、 玄 
武 岩 .更 安 岩 . 流 纹 岩 的 分 类 。1929 年 勃 林 克 曼 (有 R. Brinkmann) 进行 了 一 些 生 物 地 层 学 方 
面 的 统计 研究 工作 。 

1936 年 至 1945 年 ,数学 方法 的 应 用 范围 由 地 质 学 个 别 问题 逐渐 扩展 至 地 质 学 的 一 
分 支 。1939 年 西 姆 波 森 (G. G. Simpson) 等 编著 了 《定量 动物 学 》 一 书 ， ee 
展 葛 定 了 基础 。 美 国人 克 和 鲁 拜 因 (W. C.Krumbein) 从 1934 年 开始 进行 沉积 作用 和 地 层 的 
统计 分 析 工 作 , 成 为 美国 数学 地 质 学 的 韵 基 人 。1944 年 前 苏联 维 斯 捷 列 乌 斯 (A. 56. 
BucrTennyc) 在 前 苏联 科学 院 报告 集 上 发 表 了 《分 析 地 质 学 》 一 文 ,提出 用 定量 方法 研究 地 质 
学 问题 的 初步 思想 。 从 此 ,他 从 事 数学 地 质 工作 30 余年 ,成 为 前 苏联 数学 地 质 学 的 创始 人 
和 国际 数学 地 质 协 会 的 第 一 任 主席 。 

1946 年 至 1960 年 ,数学 方法 应 用 于 地 质 学 的 许多 分 支 , 单 变量 、 双 变量 统计 方法 被 普 
遍 应 用 。 前 苏联 已 有 人 研究 金属 矿床 元 素 的 统计 分 布 特点 。1954 年 绍 (D. M. Shaw) 等 应 
用 统计 方法 研究 地 球 化 学 问题 。1956 年 初 , 切 叶 思 (F. Chayes) 应 用 均值 .方差 .标准 差 于 岩 
如 学 饶 究 中 。1958 年 区 鲁 拜 因 开始 从 事 区 域 地 层 统计 分 析 方 面 的 工作 。 在 此 期 间 , 电 子 计 
算 机 的 应 用 和 数字 绘图 仪 的 诞生 ,为 地 质 学 与 数学 的 结合 创造 了 条 件 。1958 年 克 和 鲁 拜 因 首 
次 在 地 质 学 杂志 上 公布 电子 计算 机 地 质 应 用 程序 。 

1961 年 至 1970 年 ,数学 方法 和 电子 计算 机 在 地 质 学 中 开始 广泛 应 用 。 亚 利 桑 那 大 学 
从 1961 年 开始 召开 了 一 系列 “电子 计算 机 在 矿产 工业 中 的 应 用 ”讨论 会 。 第 二 代 计 算 机 的 
成 批 生产 和 应 用 导致 数学 地 质 学 文献 数目 激增 。1964 年 达 特 蒙 斯 大 学 第 一 次 成 功 地 应 用 
了 计算 机 分 时 系统 ,美国 堪萨斯 地 质 调查 所 召开 了 第 一 次 “电子 计算 机 在 地 球 科学 中 的 应 用 
讨论 会 ”,《 美 国 石油 地 质 工 作者 公报 杂志 设立 了 “电子 计算 机 应 用 ”的 专门 编 委 。 堪 萨 斯 地 
质 调 查 所 从 1966 年 开始 连续 出 版 电子 计算 机 程序 集 。1967 年 在 美国 石油 地 质 工 作者 协会 
中 建立 了 电子 计算 机 数据 存储 和 索取 委员 会 。 同 年 成 立 了 国际 地 质 科 学 联合 会 的 地 质数 据 
储存 .自动 处 理 和 索取 委员 会 。1968 年 在 巴黎 召开 的 国际 地 质 会 议 上 成 立 了 国际 数学 地 质 
协会 ,并 开始 出 版 4 国际 数学 地 质 协 会 杂志 》 和 《地 质 计 算 程 序 公报 》; 美 国 地 质 调 查 所 首次 公 
布 其 凯 了 计算 机 贡献 文集 ;电子 计算 机 在 地 球 科 学 应 用 方面 的 第 一 本 书 出 版 。 在 这 一 阶段 ， 
多 元 统计 方法 在 地 质 学 中 大 量 应 用 ,数学 地 质 学 发 展 成 为 一 门 独立 的 学 科 。 









石油 数字 地 策 


1971 年 后 ,数学 地 质 学 科 向 更 高 水 平 发 展 。 地 质 过 程 的 数学 模拟 在 数学 地 奈 学 中 占据 
愈 来 愈 重要 的 地 位 ,全 来 愈 多 的 数学 方法 应 用 于 地 质 学 中 ;地 质 统计 学 取得 明显 进展 ,由 法 
语 国家 向 英 语 国家 逐渐 推广 ,并 且 水 平 不 断 提高 ;地质 多 元 统计 有 形成 独立 分 支 的 趋势 。 数 
学 和 地 质 学 的 不 断 结 合 推动 了 数学 地 质 学 的 进展 。 

20 世纪 70 年 代 末 ,中 国 成 立 了 数学 地 质 学 分 会 ,先后 召开 全 国 数学 地 质 学 术 讨论 会 6 
次 ,专题 学 术 会 议 12 次 ,推动 了 我 国 数学 地 质 学 的 发 展 。 


S32 数学 地 质 学 的 主要 研究 内 容 与 方法 


数学 地 质 学 主要 研究 概率 论 与 数理 统计 、 地 质 统计 学 .地质 建 模 技 术 ,模糊 数学 ., 藉 色 理 
论 . 非 线 性 科学 .图 形 处 理 技术 等 内 容 。 

(1) 概率 论 与 数理 统计 。 主 要 包括 随机 样本 分 析 、 随 机 抽样 技术 、 壹 特 卡 罗 技 术 、 趋 势 
分 析 .回归 分 析 .判别 分 析 、 因 子 分 析 . 聚 类 分 析 .最 优 分 析 等 ,这 部 分 内 容 以 概率 论 和 数理 统 
计 理 论 为 基础 ,对 地 质数 据 进行 统计 分 析 , 得 到 相应 的 统计 结果 并 进行 地 质 解释 。 这 些 常规 
的 数学 地 质 学 方法 在 地 质 领 域 已 有 较 广泛 的 应 用 。 

(2) 地 质 统计 学 。 是 在 地 质 分 析 和 统计 相互 结合 的 基础 上 ,用 随机 函数 的 形式 体系 来 
评价 和 探索 区 域 化 地 质变 量 的 理论 和 方法 。 主 要 包括 变异 理论 \ 克 立 金 技术 等 。 

(3) 地 质 建 模 技术 。 是 运用 计算 机 技术 ,将 空间 信息 管理 .地 质 解 释 、 空 间 分 析 和 预测 、 
地 学 统计 实体 内 容 分 析 和 图 形 可 视 化 工具 等 结合 起 来 ,对 地 质 对 象 以 及 相关 的 工程 活动 进 
行 再 现 和 分 析 的 技术 。 主 要 包括 模型 与 模拟 . 建 模 性 质 、 模 型 分 类 数字 油田 ,勘探 数据 库 与 
数据 银行 .地 质 模型 等 内 容 。 

(4) 模糊 数学 。 模 糊 性 现象 是 一 种 普遍 存在 的 现象 ,而 模糊 数学 就 是 研究 和 处 理 这 些 
模糊 现象 的 一 种 数学 理论 和 方法 。 其 基本 研究 内 容 有 三 个 方面 , 即 模糊 数学 的 理论 以 及 它 
与 精确 数学 .随机 数学 的 关系 。 

(5) 灰色 理论 。 又 称 灰 色 系 统 理论 ,与 研究 “随机 不 确定 性 ”的 概率 统计 和 研究 “ 认 知 不 
确定 性 ”的 模糊 数学 相 比 ,灰色 理论 的 研究 对 象 是 具有 “部 分 信息 已 知 ,部 分 信息 未 知 ” 特 点 
的 小 样本 、 贫 信息 的 不 确定 系统 。 灰 色 系 统 主要 研究 方法 包括 灰色 系统 建 模 方法 、 灰 色 系 统 
控制 理论 .其 色 关 联 分 析 方 法 .灰色 预测 方法 .灰色 规划 方法 .灰色 决策 方法 等 。 

(6) 非 线 性 科学 。 非 线性 科学 研究 的 是 变量 间 存 在 的 非 线 性 关系 。 自 然 现象 的 复杂 性 
决定 了 用 非 线 性 描述 的 必要 性 , 它 使 所 进行 的 描述 更 为 合理 可 信 。 地 质 学 中 的 非 线 性 理论 
和 方法 包括 分 形 理 论 . 耗 散 结 构 理 论 ,混沌 理论 、 突 变 理论 .协同 学 、 非 线性 动力 学 等 。 

(7) 图 形 处 理 技术 。 是 用 计算 机 图 形 化 手段 对 地 质 信息 和 研究 成 果 进 行 展 示 和 分 析 的 
一 种 技术 ,其 主要 内 容 包 括 图 形 算法 .计算 机 显示 技术 等 。 随 着 计算 机 图 形 技 术 的 发 展 , 计 
算 机 绘图 工作 进展 迅速 ,在 20 世纪 80 年 代 后 期 基本 上 发 展 成 为 一 门 独立 的 学 科 。 


S 3 未 来 展望 


目 然 科 学 的 一 般 发 展 趋势 是 由 定性 研究 向 定量 研究 发 展 ,而 数学 地 质 学 正 是 地 质 学 由 
定性 研究 四 定量 研究 发 展 的 主要 手段 ,虽然 目前 在 地 质 学 研究 中 并 不 占 主导 地 位 ,但 由 于 它 
和 人 尖端 科学 技术 在 地 质 学 中 的 应 用 密切 相关 ,可 以 预见 数学 地 质 理论 和 方法 必 将 在 地 质 学 

研究 中 发 挥 十 分 重要 的 作用 。 今 后 数学 地 质 学 的 发 展 主 要 有 以 下 几 个 方向 : 


Te 






弟 一 前 结论 


(1) 传统 数学 地 质 学 方法 的 进一步 改进 与 应 用 。 以 多 元 统计 分 析 为 主 的 传统 数学 地 质 
学 方法 ， 日 前 已 在 许多 地 质 定 量 研究 中 得 以 应 用 ,事实 也 证 明了 这 些 方法 的 有 效 性 。 但 这 些 
传统 数学 地 质 学 方法 在 取得 成 功 的 同时 ,也 暴露 出 不 少 问题 。 如 数学 模型 与 地 质 概念 模型 
的 吻合 程度 因 所 研究 的 对 象 不 同 而 有 较 大 差异 ,甚至 有 些 偏 差 过 大 ,导致 处 理 结果 无 法 解释 
地 质 现象 。 虽然 原因 是 多 方面 的 ,但 数学 模型 本 身 的 局 限 性 也 显 而 多 匈 。 今后 ,在 合理 完善 
数学 模型 的 基础 上 ,传统 的 数学 地 质 学 方法 依然 有 强大 的 生命 力 。 

(2) 非 线性 科学 在 地 质 学 中 的 进一步 应 用 。 地 质 系统 是 一 个 复杂 的 巨 系统 ,具有 非 平 
衡 性 . 非 线 性 、 多 尺度 性 .突变 性 、 自 组 织 性 、 自 相似 性 有 序 性 和 随机 性 等 特点 ,因此 ,为 了 研 
究 和 解决 地 质 系统 的 重大 理论 和 实际 问题 ,必须 应 用 非 线 性 理论 和 方法 。 一 个 被 称 为 “ 非 线 
性 地 质 学 ”的 新 发 展 方向 越 来 越 引起 人 们 的 重视 ,将 逐渐 得 到 推广 和 应 用 。 

(3) 地 理 信 息 系 统 (geographic information system, GIS) 在 地 质 学 中 的 推广 应 用 。 地 
理 信息 系统 是 计算 机 软 硬 件 支持 下 的 空间 数据 输入 、 存 储 、 检 索 、 运 算 、 显 示 和 综合 分 析 的 应 
用 技术 系统 ;该 系统 的 研究 重点 是 空间 实体 及 其 相互 关系 ,主要 用 途 是 分 析 和 处 理 在 一 定 地 
理 区 域 中 分 布 的 各 种 现象 和 过 程 。 近年 来 ,地 理 信息 系统 已 逐渐 应 用 于 地 质 研究 。 由 于 该 
系统 自身 的 特点 及 优势 ,今后 必 将 成 为 数学 地 质 学 研究 的 重要 方向 。 

(4) 人 工 智能 在 地 质 学 中 的 应 用 将 进一步 发 展 。 除 了 继续 建立 各 种 地 质 专 家 系统 外 ， 
将 更 重视 多 种 人 工 智 能 技术 的 综合 应 用 ,特别 是 应 用 人 工 神经 网 络 和 遗传 算法 ,使 人 工 智 能 
在 地 质 学 中 的 应 用 达到 一 个 新 的 高 度 。 

(5) 地 质数 据 库 共享 技术 。 在 计算 机 网 络 技术 迅速 发 展 的 基础 上 ,利用 数据 库 共享 技 
术 ,可 以 充分 使 用 分 布 在 各 地 的 通用 勘探 数据 库 .图 形 库 及 数据 银行 中 的 数据 资源 ,随时 随 
地 提供 最 新 研究 资料 。 

(6) 数学 新 理论 新 方法 .计算 机 新 技术 的 不 断 引 进 。 对 一 些 用 目前 的 数学 方法 难以 描 
述 的 地 质 现象 , 随 着 数学 理论 和 计算 机 技术 的 发 展 , 问 题 将 得 以 合理 解决 ,从 而 提高 数学 地 
质 学 方法 的 应 用 价值 。 

(7) “数字 油 田 ” 技 术 的 推广 应 用 。 利 用 测绘 .数据库 、. 地 理 信 息 系 统 .因特网 .虚拟 现实 
等 技术 ,可 将 油田 勘探 .开发 .生产 过 程 中 的 资料 采集 .处 理 , 存 储 . 显 示 等 环节 实现 数字 化 和 
可 视 化 。 结 合 分 析 和 运算 功能 ,可 更 加 准确 地 预测 油气 资源 的 分 布 状况 ,实现 决策 的 合理 性 
及 提高 研究 工作 效率 。 








第 二 章 ”地 质变 量 与 地 质数 据 


S1 地 质变 量 

一 、 地 质变 量 的 概念 及 其 分 类 

1. 地 质变 量 的 概念 

地 质变 量 是 反映 某 地 质 现象 在 时 间或 空间 上 变化 规律 的 量 。 如 生 油 岩 的 厚度 .地 层 的 
埋藏 深度 、 生 油 岩 中 有 机 质 的 丰 度 等 。 

2. 地 质变 量 的 分 类 

造成 地 质 现象 的 因素 的 复杂 性 ,导致 表示 不 同 地 质 特征 的 地 质变 量 各 不 相同 。 但 是 ,可 
以 根据 它们 所 取 数 据 的 性 质 及 方法 ,将 其 分 为 观测 变量 (定性 变量 和 和 定量 变量 ) 和 综合 变量 。 

观测 变量 是 可 以 直接 进行 观测 .分 析 或 度量 的 地 质变 量 。 如 地 层 的 厚度 .石油 的 密度 和 
粘度 .岩石 的 颜色 等 。 

综合 变量 是 把 两 个 或 两 个 以 上 的 观测 变量 按 一 定 的 方式 进行 组 合 而 得 到 的 具有 综合 意 


义 的 地 质变 量 。 如 区 分 天 然 气 成 因 类 型 的 甲烷 系数 MCM = op 当 M >99% 时 , 认 


为 是 生物 成 因 气 ,否则 认为 是 热 解 成 因 气 ，。 又 如 有 机 质 转化 率 (总 烃 与 有 机 碳 之 比 ) 

3， 地 质变 量 的 观测 值 

用 各 种 化 学 .物理 以 及 直接 观测 的 方法 获得 的 地 质变 量 的 各 种 数据 和 其 他 形式 记录 的 

资料 统称 为 地 质变 量 的 观测 值 。 

二 、 地 质变 量 的 特征 

1. 具有 明确 的 地 质 意 义 

地 质 意 义 主要 是 指 对 地 质变 量 所 代表 的 特定 研究 对 象 的 认识 ,主要 包括 :对 地 质变 量 所 
代表 的 石油 地 质 特 征 的 认识 ,如 地 层 的 时 代 、 地 层 温 度 . 圈 财 财 合 面积 等 ;对 地 质变 量 所 代表 
的 盆地 地 球 化 学 特征 的 认识 ,如 有 机 质 类 型 和 丰 度 . 干 酷 根 成 熟 度 等 ;对 地 质变 量 所 代表 的 
地 球 物理 特征 的 认识 等 。 

2， 具 有 明显 的 统计 性 质 

很 多 地 质变 量 是 随机 变量 ,因此 ,它们 的 观测 值 具有 明显 的 统计 意义 ,如 观测 值 的 平均 
值 是 地 质变 量 数学 期 望 的 估计 值 , 而 观测 值 的 方差 反映 了 地 质变 量 在 研究 区 域 上 的 变异 。 

3， 具 有 相关 性 

地 质变 量 之 间 具 有 一 定 程度 的 相关 性 ,如 岩石 的 渗透 率 与 有 效 孔 际 度 密切 相关 ， 

三 、 地质 变量 的 选择 

分 析 研 究 地 质变 量 的 目的 是 想 通 过 它们 预测 地 质 体 的 特征 及 有 关 的 地 下 资源 。 用 什么 
样 的 地 质变 量 才 能 较 好 地 实现 研究 目标 ,这 就 是 地 质变 量 的 选择 问题 。 例 如 ,要 想 通 过 一 些 
地 质变 量 预测 茶 沉 积 单元 的 油气 资源 量 ,就 要 选择 与 油气 资源 量 相关 的 生 油条 件 、 储 集 条 

件 . 保 存 条 件 、 圈 闭 条 件 等 地 质变 量 。 一 般 来 说 ,地 质变 量 的 选择 应 遵循 以 下 基本 原则 ， 









镶 二 意 地质 变 硬 与 地 质 散 棉 


(1) 基于 地 质 概念 模 型 。 以 相关 地 质 学 科 理 论 为 指导 ,分 析 、 建 立 研究 问题 的 地 质 概念 
模型 ,依据 地 质 概念 模型 选择 相应 的 地 质变 量 。 

(2) 结合 地 质变 量 间 的 相关 性 。 地 质变 量 之 间 存 在 着 不 同 程度 的 相关 性 ,应 选择 与 矿 
藏 形成 或 地 质 体 特征 等 有 密切 联系 的 控 矿 因素 和 找 矿 标志 。 

(3) 地 质变 量 要 有 代表 性 。 地 质变 量 的 代表 性 是 指 所 选择 的 地 质变 量 能 否 较 好 地 表征 
某 地 质 作 用 过 程 的 进行 程度 ,或 者 变量 的 观测 区 与 未 观测 区 之 间 的 相似 程度 。 

(4) 地 质变 量 要 有 明确 的 地 质 意义 。 拟 定 的 地 质变 量 ,特别 是 构造 的 综合 型 地 质变 量 
要 有 确切 的 地 质 含义 。 如 在 油气 资源 评价 中 , 生 油 兰 体积 与 沉积 岩 体 积 之 比 表 示 评 价 区 的 
生 油 条 件 , 而 近 油 源 圈 闭 面 积 与 沉积 岩 面积 之 比 则 表示 评价 区 的 圈 闭 条 件 , 总 烃 与 有 机 碳 之 
比 表 示 有 机 质 转化 率 等 。 


932 地 质数 据 


一 、 地 质数 据 的 概念 

用 以 代表 地 质 体 或 其 他 自然 产物 特性 的 实物 样子 称 为 样品 。 地 质 样品 的 采集 对 象 有 宕 
体 、 地 层 . 矿 体 、 油 气 、 生 油 岩 、 储 集 层 .土壤 及 各 种 松散 的 沉积 物 .地 表 水 及 地 下 水 .植物 、 空 
气 等 。 用 各 种 物理 、 化 学 方法 以 及 直接 观测 的 方法 获得 的 用 以 表示 样品 特性 的 各 种 数据 和 
其 他 形式 记录 的 资料 统称 为 地 质数 据 或 样品 变量 观测 值 。 

二 、 地 质数 据 的 分 类 

地 质数 据 是 地 质 样品 的 变量 观测 值 。 因 此 ,从 狭义 上 讲 地 质数 据 分 为 定性 数据 和 定量 
数据 ,从 广义 上 讲 它 可 以 是 定性 数据 .定量 数据 .图 形 或 其 他 形式 记录 的 资料 等 。 根 据 地 质 
数据 的 来 源 , 地 质数 据 分 为 观测 .综合 .经 验 数 据 三 类 。 

1. 观测 数据 

指 对 样品 (或 采样 对 象 ) 用 各 种 物理 .化 学 或 直接 观测 的 方法 获得 的 表达 样品 (或 采样 对 
象 ) 特 性 的 数据 。 这 种 源 于 样品 .没有 经 过 任何 加 工 处 理 的 数据 ,又 称 为 原始 数据 。 依 据 数 
据 的 性 质 ,又 分 为 定性 数据 和 定量 数据 两 类 。 

(1) 定性 数据 。 定 性 数据 是 指 用 符号 或 代码 表示 的 没有 数量 概念 的 观测 数据 。 可 将 其 
分 为 名 义 型 和 有 序 型 两 类 : 

QD 名 义 型 数据 是 没有 数量 概念 和 次 序 之 分 ,但 彼此 之 间 有 “相等 ”或 “不 相等 ”关系 的 定 
性 数据 。 如 岩石 的 红 . 绿 、 灰 .黄色 可 以 用 字母 A,B,C,D 表示 ,又 如 砂岩 泥岩、 灰 岩 可 以 用 
S, 人 ,万 代替 ,它们 之 问 有 A = A,A 关 B,S = S,S 关 NN 的 关系 。 

@ 有 序 型 数据 是 没有 数量 概念 ,但 彼此 之 间 具 有 次 序 关 系 的 定性 数据 。 如 I 工 , 卫 ,本 
型 干 酷 根 可 用 数字 1,2,3 表示 ,它们 之 间 有 工 型 于 酷 根 的 生 烃 湾 力 优 于 下 型 干 酷 根 的 关系 。 

(2) 定量 数据 。 定 量 数据 是 指 用 数值 来 描述 的 观测 数据 。 可 将 其 分 为 间隔 型 数据 和 上 比 
例 型 数据 两 类 : 

QD 间隔 型 数据 是 有 明确 数量 概念 和 地 质 含义 的 定量 数据 。 如 以 基准 海平 面 起 算 的 地 
层 分 层 数 据 就 是 典型 的 间隔 型 数据 。 它 们 之 间 具 有 相等 .不 等 以 及 大 于 、 小 于 关系 ,其 差异 
具有 实际 的 地 质 意义 。 如 某 地 层 底 界 和 顶 界 分 层 深度 值 之 差 等 于 该 地 层 的 厚度 。 

@ 定量 数据 的 比值 构成 比例 型 数据 。 这 类 数据 本 身 及 它们 的 差 值 都 有 实际 意义 。 比 
例 型 数据 是 大 于 等 于 0 的 实数 组 成 的 数据 集合 ,这 是 它 与 间 隅 型 数据 的 一 个 重要 区 别 。 如 






石油 数学 地 质 人 


项 地 层 厚 度 的 比值 反映 其 中 一 个 地 层 厚 度 是 另 一 个 地 层 厚度 的 百 分 之 几 , 或 者 反映 茶 种 沉 
积 环境 ,或 者 反映 生 油 条 件 等 。 

2. 综合 数据 

综合 数据 是 指 由 定量 数据 (或 经 定量 化 处 理 后 的 定性 数据 ) 经 有 限 次 算术 运算 后 得 到 的 
定量 数据 。 这 种 数据 具有 明显 的 地 质 意 义 , 例 如 总 烃 含 量 .时 间 - 温 度 指数 . 生 油 岩 厚度 与 这 
积 岩 厚度 的 比 等 。 另外 ,随机 变量 的 各 种 数字 特征 ,如 平均 值 、 标 准 差 . 极 差 、 相 关系 数 等 都 
可 视 为 综合 数据 。 

3. 经 验 数 据 

经 验 数 据 是 在 研究 地 质 现象 和 规律 的 基础 上 ,根据 大 量 实际 资料 和 经 验 总 结 归纳 出 的 
数据 ,如 单 储 系数 、 排 烃 系 数 、 京 集 系 数 等 。 经 验 数 据 是 大 量 地 质 信 息 的 综合 反映 ,地 质 意义 
明确 ,但 它 受 哪些 主 控 因素 的 影响 ,以 及 各 因素 之 间 的 作用 关系 等 问题 目前 尚 不 清楚 。 另 
外 ,经 验 数 据 还 具有 较 明显 的 地 域 性 。 因此 ,在 油气 资源 评价 等 工作 中 使 用 经 验 数据 时 ,要 
特别 注意 对 比 地 质 条 件 的 相似 性 。 

三 、 地 质数 据 的 主要 特点 及 数据 矩阵 

1. 地 质数 据 的 主要 特点 

由 于 地 质 系统 .地质 条 件 和 地 质 作用 的 复杂 性 ,测试 手段 的 差异 等 ,导致 地 质数 据 有 如 
下 几 个 主要 特点 : 

(1) 地 质数 据 类 型 多 ,性 质 不 一 ,地 质 内 涵 丰 富 , 量 纲 不 统一 ,定量 数据 的 数量 级 相差 
大 ,各 类 数据 的 数量 和 精度 相差 悬殊 。 

(2) 地 质数 据 往往 是 多 种 地 质 因素 综合 作用 的 结果 , 故 上 共有 混合 分 布 特征 。 

(3) 地 质数 据 以 定量 数据 为 主 , 而 定性 数据 的 定量 化 研究 和 应 用 目前 尚 不 成 熟 。 

地 质数 据 的 特点 决定 了 地 质数 据 不 是 单一 性 质 的 数据 集合 ,而 是 多 种 来 源 的 混合 数据 
集合 ,这 一 特点 客观 存在 且 不 易 改 变 。 使 用 地 质数 据 时 ,要 注意 它们 的 适用 性 ,同时 还 要 研 
究 和 改进 数据 加 工 和 处 理 技 术 , 发 挥 各 种 地 质数 据 的 作用 , 方 可 使 地 质 研究 获得 良好 的 效 
果 。 

2. 数据 矩阵 

为 便于 数据 处 理 , 地 质数 据 常 用 数据 矩阵 表示 。 假 设 有 个 样品 ,每 个 样品 有 m 个 变 
量 , 那 么 样品 变量 的 观测 值 可 用 以 下 数据 矩阵 半 表 示 : 

Xl Xl “之 lm 


入 (ZE im 二 


式 中 Xs 一 一 第 i 个 样品 第 3 个 变量 的 观测 值 。 
常 把 于 的 第 7 列 记 为 X;, 它 是 第 ; 个 变量 的 n 次 观测 值 。 有 时 也 将 数据 窍 阵 记 为 : 
X11 Xl? ”ln 
之 21 TL22 ”Xon 


入 一 4 一 


Tm m2 "rm 


式 中 ” 志 一 一 第 i 个 变量 的 第 ;7 次 观测 值 。 


HH Er 
li 
一 a 和 
a 
an 
| 









镶 一 意 地 质变 最 与 地 不孝 据 


例如 ,地 质 图 闭 的 5 个 参数 ( 表 2-1) 可 以 用 5 行 4 列 的 矩阵 式 (2-1) 表 示 。 
表 2-1 地 质 国 闭 数 据 


图 闭 编号 闭会 面积 / (10? m?) 内 合 高 度 /m 长 短 轴 比 埋藏 深度 /m 


2 000 


EC 


1 800 


| 中 Co 性 一 


2 500 


1 000 500 1.5 2000 
250 150 1.0 2 200 
X 一 (ra 一 |100 70 3.0 1500 (2-1) 
10 200 2.0 1 800 
40 100 5.0 2 500 


3 3 地 质数 据 的 预 处 理 


地 质数 据 的 预 处 理 是 指 在 定量 研究 地 质问 题 时 ,预先 对 原始 数据 进行 的 各 种 处 理 。 其 
主要 内 容 为 定量 数据 的 标准 化 .定性 数据 的 定量 化 .原始 数据 的 网 格 化 .原始 数据 的 简 缩 和 
增补 . 离 群 数据 的 识别 与 剔除 等 。 

一 、 定 量 数据 的 标准 化 

定量 数据 的 标准 化 是 对 变量 的 观测 值 进行 标准 化 。 其 目的 是 消除 或 抑制 不 同 变量 观测 
值 数 量 级 的 巨大 差异 ,使 它们 在 同一 尺度 范围 下 参与 地 质 研 究 。 标 准 化 方法 有 标准 差 标准 
化 、 极 差 标准 化 、 极 差 正规 化 .总 和 标准 化 .最 大 值 标准 化 、 模 标准 化 和 中 心 标准 化 等 。 其 中 
最 常用 的 是 标准 差 标准 化 、 极 差 标准 化 和 极 差 正规 化 。 

1, 标准 差 标 准 化 

标准 差 标准 化 是 变量 X; 的 每 个 观测 值 x; 减 去 观测 值 的 平均 值 X; ,再 除 以 观测 值 的 标 
准 差 S; , 即 数据 矩阵 X 中 第 ; 列 上 的 每 个 元 素 减 去 该 列 元 素 的 平均 值 ,再 除 以 第 ; 天 于 
的 标准 差 ,最 终 得 到 变量 XX';。 变 换 公式 为 ， 

‘j= (zx; — X;)/S, (i = 1,2, ,n= 1,2,. ,mm) (2-2) 
标准 化 后 的 数据 ， 

前 的 数据 (原始 数据 , 即 第 i 个 样品 第 ; 个 变量 的 观测 值 )，; 


X, 一 一 第 ; 个 变量 观测 值 的 平均 值 ， X, = 工 mi (J = 1,2,",m); 





式 中 x"; 








Sj 一 一 第 7 个 变量 观测 值 的 标准 差 ， S, ~ Dz, 二 X))2 (7 ] ,2,° 771), 
i=1 


变量 X'; 叫做 标准 化 变量 ,其 特点 是 平均 值 X'; 二 0, 标准 差 S'; 二 1, 故 变量 X'; 又 叫做 
规格 化 变量 。 








对 式 (2-1) 中 的 数据 标准 差 标准 化 后 ,得 到 新 的 数据 矩阵 : 


1. 949 1.916 一 0.707 0. 000 

一 0.081 一 0.350 一 1.016 0. 587 

X 一 | 一 0.487 一 0.867 0.354 一 1.468 
一 0.731 一 0.026 一 0.354 一 0.587 

一 0.650 一 0.673 1.768 1. 468 


2. 极 差 标 准 化 
极 差 是 第 ;j 个 变量 Xi; 观测 值 的 最 大 值 与 观测 值 最 小 值 的 差 , 即 : 


AX， max x; 一 min My (7 = 1 ,2,* ,mm) 
1 xi li 


极 差 标准 化 是 变量 X; 的 每 一 个 观测 值 xy (i 二 1,2,…,n) 减 去 XX; 观测 值 的 平均 值 X，， 

再 除 以 极 差 AX;。 变 换 公 式 为 : 

z's = (zx; — X,)/AX, 

式 中 zx 标准 化 后 的 数据 ; 
2 一 一 标准 化 前 的 数据 (原始 数据 ); 
X, 一 一 第 ; 个 变量 观测 值 的 平均 值 ; 
AXi 一 一 第 7 个 变量 观测 值 的 极 差 。 
极 差 标准 化 后 ,变量 X ;的 极 差 为 1。 对 式 (2-1) 中 数据 极 差 标准 化 后 ,得 到 新 的 数据 
矩阵 : | 


(i = 1,2y Nn; = 1 ,2 ,°° ,mm) (2-3) 








0.727 0.688 一 0. 250 0. 000 
一 0.030 一 0.126 一 0.375 0. 200 
b= 0,182 一 0.312 0.125 一 0.500 
一 0.273 一 0.009 一 0.125 一 0. 200 
一 0.242 一 0.242 0. 625 0. 500 
3, 极 差 正 规 化 
极 差 正规 化 的 变换 公式 为 ; 
i 一 minzs)/AX, (i = 1l,2, nN;37 一 1,2 ,mm) (2-4) 
式 中 zj 一 一 标准 化 后 的 数据 ; 
Ts 标准 化 前 的 数据 (原始 数据 ); 
AX,; 一 一 第 ; 个 变量 观测 值 的 极 差 ; 
min xz; 一 一 第 j 个 变量 观测 值 的 最 小 值 。 
对 式 (2-1) 中 数据 极 差 正规 化 后 ,得 到 新 的 数据 矩阵 ， 
1.000 1.000 0,.125 0.500 
0.242 0.186 0.000 0.700 
X 一 |0.091 0.000 0.500 0.000 
0.000 0.302 0.250 0.300 
0.030 0.070 1.000 1.000 


由 式 (2-4) 可 知 , 变 量 X'; 最 大 值 为 1, 且 x'; 之 0, 即 新 数据 在 区 间 [0,1] 内 。 


名 二 总 地 扶 变 最 与 地 和 贰 数据 





二 、 定 性 数据 的 定量 化 

定性 数据 的 定量 化 是 指 把 定性 数据 变换 为 数值 。 根据 定性 数据 状态 的 多 少 ,可 分 为 二 
态 和 多 态 有 序 定 性 数据 。 两 类 定性 数据 的 定量 化 方法 都 是 对 定性 数据 的 状态 赋 仁 ， 

1. 二 态 定 性 数据 的 变换 

只 有 两 种 对 立 状态 的 定性 数据 为 二 态 定性 数据 。 可 用 0 和 1 表示 这 两 个 状态 ,从 而 实 
现 定 性 数据 的 定量 化 。 如 某 观 测 点 有 无 某 种 化 石 , 就 只 有 两 种 可 能 , 若 有 则 用 1 表示 ,看 无 
就 用 0 代表 。 一 般 来 说 , 按 以 下 原则 处 理 : 






二 态 定 性 数据 


2， 多 态 有 序 定性 数据 的 变换 
多 态 有 序 定 性 数据 是 指 状态 多 于 两 个 ,并 且 状 态 又 可 按 一 定 次 序 排列 的 定性 数据 。 如 


储 层 岩 心 的 含油 性 , 按 含油 程度 可 分 为 四 级 ,采用 等 差 方 式 赋值 如 下 : 
ie 










又 如 , 按 颜色 可 将 泥岩 分 为 四 级 ,为 区 分 各 级 泥岩 的 生 油 能 力 , 可 采用 非 等 差 方式 赋值 
如 下 : 


] 





三 、 原始 数据 的 网 格 化 

原始 数据 的 网 格 化 是 指 把 平面 上 无 规则 分 
布 的 定量 数据 z; 分 配 到 和 矩形 网 格 的 每 个 交点 上 
(图 2-1) ,产生 规则 分 布 的 定量 数据 。 网 格 化 的 
方法 很 多 ,如 全 点 插值 法 、 圆 内 插值 法 、 曲 面 插值 
法 . 克 立 金 法 等 。 在 此 仅 介 绍 既 简单 又 实用 的 按 
象限 取 点 距离 加 权 平 均 法 。 

以 网 格 交点 (i,j) 为 原点 建立 坐标 系 (图 2-1)， OE 
在 各 象限 内 各 取 一 个 距 点 (i, 丫 最 近 的 数据 点 , 记 为 p; (i 二 1,2,3,4), 各 点 上 相应 的 数据 值 
分 别 为 z;(i 二 1,2,3,4), 可 以 用 p; 点 上 的 数据 值 z; 的 算术 平均 值 


_ 下去 
= 一 下 之 
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作为 网 格 交 点 (i,7) 上 的 估计 值 z; 。 

考虑 到 数据 点 距 网 格 交 点 (i,j) 越 近 , 对 网 格 点 的 估计 值 影响 越 大 ,因此 取 距 离 的 倒数 
作为 权 求 网 格 交 点 (i,7) 的 估计 值 。 

假设 数据 点 p; (i 二 1,2,3,4) 到 网 格 交 点 (i, 门 的 距离 为 di Ci 一 1,2,3,4) ,那么 网 格 交 所 
(i,7) 上 的 估计 值 为 : 


-Vy 3 (2-5) 
dl Et dd 


在 按 式 (2-5) 计 算 z; 的 过 程 中 , 当 出 现 4; 二 0 时 , 则 以 z; 作为 网 格 点 (i,7) 上 的 信 计 值 ， 

对 于 某 些 网 格 点 (如 边界 网 格 点 ) ,不 能 在 四 个 象限 中 都 找到 数据 点 , 则 在 有 数据 点 的 象 
限 内 取 距 离 近 的 点 上 的 数据 进行 加 权 平 均 ( 至 少 有 一 个 数据 )。 在 按 象 限 取 点 距离 加 权 平 均 
插值 法 中 ,每 个 象限 内 也 可 以 取 多 个 距 插 值 点 近 的 数据 点 进行 加 权 平 均 ,其 过 程 与 上 类 似 。 

对 每 个 网 格 交 点 进行 上 述 计 算 , 即 可 完成 对 原始 数据 的 网 格 化 工作 。 

【 例 1 如 图 2-2 所 示 , 已 知 四 个 数据 点 pi (4,4), ps (1， 
4),pa(1l,2) 和 ps(5;2), 各 点 上 的 数据 值 依次 为 3,2,2,2, 求 
插值 点 p(3,3) 上 的 估计 值 。 

解 ，: 

@ 各 点 到 点 p(3,3) 的 距离 :di 一 V2 ,ds 一 ds 二 ds 一 V5。 


4 
@ 式 (2-5) 的 分 母 , 》) 二 一 2. 048 7。 
:一 1 


@ 式 (2-5) 的 分 子 ， > 一 4.804 5。 


@ 插值 点 的 值 :4. 804 5 二 2.048 7 一 2.345 1 。 

四 、 原 始 数据 的 简 缩 和 增补 

1. 原始 数据 的 简 缩 

当 分 布 在 研究 区 上 的 地 质数 据点 很 多 (可 能 出 现 反 映 相 同 地 质 特 征 的 多 个 近似 数据 点 ) 
时 ,或 者 是 数据 在 研究 区 上 的 分 布 极 不 均匀 时 ,不 仅 会 使 计算 量 增 加 ,而 且 也 无 助 于 最 终 的 
成 果 解 释 , 甚 至 在 计算 过 程 中 还 会 出 现 不 可 预料 的 计算 病态 问题 。 因 此 ,就 需要 对 作用 不 大 
或 相近 .可 有 可 无 的 多 余数 据 予 以 舍弃 ,这 就 是 数据 的 简 缩 。 

数据 的 简 纠 方法 一 般 包 括 分 区 加 权 平 均 法 .分 区 滑动 平均 法 和 随机 删 点 法 。 

(1) 分 区 加 权 平 均 法 。 

假设 研究 区 内 每 个 地 质数 据点 有 m 个 变量 ,根据 实际 需要 将 研究 区 划分 成 大 小 相等 或 
不 等 的 nn 个 小 区 ,并 且 每 个 小 区 内 至 少 有 一 个 数据 点 ,那么 第 7 个 小 区 内 第 i 个 数据 点 上 第 
k 个 地 质变 量 的 观测 值 为 zj Gj 二 12 一 1 2 ,msi 一 1,2,…,n;) ,而 第 ;个 小 区 
内 第 上 个 地 质变 量 的 简 缩 值 为 : 














之 讯 一 en (7 一 1 2 103 人 1 ,2,* ,7m) (2-6) 
式 中 zx 第 ; 个 小 区 第 大 个 变量 观测 值 的 简 缩 值 ; 
nj 一 一 第 ; 个 小 区 地 质数 据点 数 ; 
zi 一 一 第 7 个 小 区 第 i 个 数据 点 上 第 个 变量 的 观测 值 。 
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按照 式 (2-6) 对 研究 区 内 原始 数据 进行 处 理 后 ,相当 于 每 个 小 区 内 有 一 个 有 效 数据 后 ， 
从 而 将 原来 大 量 的 数据 点 简化 为 n 个 有 效 数据 点。 

(2) 分 区 滑动 平均 法 。 

分 区 滑动 平均 法 的 分 区 方法 和 分 区 原则 与 分 区 加 权 平均 法 相同 ， 但 这 种 方法 要 考 虚 简 
缩 后 数据 点 的 位 置 。 

如 果 第 j 个 小 区 内 有 nj 个 数据 点 ,每 个 数据 点 上 有 mx 个 地 质变 量 的 观测 值 ,其 中 第 i 
个 数据 点 的 坐标 为 (x, yj) ,那么 第 j 个 小 区 简 缩 后 的 有 效 数据 人 
(2-7),(2-8) 给 出 : 


Pi 7 
一 > zi > zit 
和 CO 
J 了 
YR 一 2 de a cin > zi 
i=1 ;一 1 
与 
Zk 一 DT/ (2-8) 
i 一 1 


(j= 1,2,° nk = 1,2," ,7m) 
式 中 zx ,yx 一 一 第 j 个 小 区 第 六 个 地 质变 量 观测 值 简 缩 后 的 横 坐 标 和 纵 坐 标 ; 
第 ; 个 小 区 第 & 个 地 质变 量 的 简 缩 值 : 
zsynk 一 第 7) 个 小 区 第 & 个 地 质变 量 观测 值 的 第 ; 个 数据 点 的 横 坐 标 与 纵 坐 标 ; 
第 ; 个 小 区 第 & 个 地 质变 量 观测 值 的 第 i 个 数据 ; 
个 小 区 地 质数 据点 数 。 

按 上 述 公式 算出 的 坐标 有 m 个 ,如 果 需 要 一 个 统一 的 坐标 后 , 则 可 根据 地 质变 量 观测 
值 的 大 小 ,采用 加 权 平 均 的 方法 算出 。 另 外 ,根据 实际 需要 ,也 可 采用 其 他 的 计算 方法 。 

(3) 随机 删 点 法 。 : 

对 于 探 区 内 的 局 部 数据 点 密集 区 ,随机 删 去 一 些 数据 点 , 既 可 减少 计算 工作 量 , 又 可 提 
高 计算 过 程 的 稳定 性 。 删 除 点 的 方法 是 对 数据 点 编号 ,用 随机 抽样 法 删 去 其 中 的 一 些 数 据 
尽 。 

2， 数 据 的 增补 

在 一 般 情况 下 , 探 区 内 投入 的 工作 量 是 不 均匀 的 ,特别 是 勘探 早期 阶段 。 因 此 在 区 域 上 
会 出 现 数 据点 空白 区 ,在 这 种 空 日 区 往往 需要 补充 一 些 数据 点 ,这 就 是 数据 的 增补 ，。 

在 数据 点 空白 区 补充 数据 点 时 ,可 以 用 临近 数据 点 上 的 数据 外 推 , 即 根 据 数 据 的 变化 趋 
势 补充 适量 的 数据 点 ,也 可 以 用 某 种 插值 方法 补充 一 定数 量 的 数据 点 。 值 得 注意 的 是 : 补 点 
的 目的 是 为 了 全 区 计算 的 稳定 性 ,而 原 空白 区 的 计算 结果 仅 供 参考 。 

此 外 ,对 于 多 变量 的 地 质 样 品 , 由 于 分 析 化 验 项 目 不 一 定 完 全 一 致 或 其 他 原因 ,导致 某 
些 样品 缺少 某 些 变量 的 观测 值 。 对 于 那些 研究 需要 而 又 缺少 观测 值 的 变量 ,可 以 用 该 变量 
邻近 区 域 上 观测 值 的 平均 值 作为 该 变量 观测 值 的 近似 值 。 

五 、 离 群 数据 的 识别 与 剔除 

相对 研究 区 的 观测 数据 来 说 ,局 部 的 异常 高 值 和 异常 低 值 称 为 离 群 数据 。 这 种 数据 往 
往 直 接 影响 到 基于 观测 数据 的 数据 处 理 过 程 和 对 计算 结果 的 合理 解释 。 对 于 某 些 已 知 因 素 











造成 的 离 群 数据 ,可 进行 相应 的 数据 校正 。 如 在 油气 地 表 化 探 中 ， i di 十 
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壤 的 类 型 和 颜色 等 导致 的 有 关 指标 含量 的 差异 ,经 过 相应 的 校正 , 即 可 以 消除 数据 中 的 干 
扰 。 

如 果 离 群 数据 是 地 质 现 象 的 真实 反映 , 当 它们 对 数据 处 理 过 程 和 计算 结果 产生 消极 影 
响 时 ,应 对 这 些 数据 进行 适当 处 理 。 对 于 那些 人 为 等 因素 造成 的 错误 数据 , 理 所 应 当地 删 际 
或 重新 进行 观测 。 然 而 ,判断 造成 离 群 数据 的 因素 是 很 困难 的 。 在 实际 工作 中 ,总 是 假设 数 
据 是 真实 的 ,在 此 假设 下 讨论 对 离 群 数据 的 挑选 和 处 理 。 

对 离 群 数据 进行 处 理 的 第 一 步 工 作 是 挑选 离 群 数据 ,这 就 涉及 离 群 数据 的 界限 问题 。 
下 面 简单 介绍 离 群 数据 的 界限 确定 和 处 理 方 法 。 

1. 类 比 法 

以 实际 工作 经 验 确 定 离 群 数据 的 界限 ,以 此 界限 识别 区 域 上 的 离 群 数据 。 斯 米尔 诺 夫 
根据 实际 经 验 ,总 结 出 确定 矿床 品位 离 群 数据 的 界限 ( 表 2-2, 其 中 离 群 品位 高 出 平均 品位 

的 倍数 项 是 经 验 数据 ) 。 

从 矿床 成 因 角 度 看 , 绝 大 多 数 的 油气 藏 都 属于 与 沉积 岩 有 关 的 矿床 。 所 以 ,确定 油气 勘 
探 , 开 发 中 石油 地 质数 据 界 限时 ,可 以 参照 表 2-2 中 的 工 , 开 矿床 类 型 。 
表 2-2 矿床 品位 离 群 数据 的 界限 


矿床 类 型 组 分 分 布 性 质 离 群 品位 高 出 平均 品位 的 倍数 


2， 计算 法 


用 经 验 公式 确定 离 群 数据 的 界限 。 沃 洛 多 莫 夫 给 出 的 计算 离 群 数据 界限 的 经 验 公 式 

为 : | 
ch =e nm l(c — cs) /ee (2-9) 

正常 数据 的 最 大 值 ,大 于 ch 的 数据 即 为 离 群 数据 ， 

校正 前 (包括 离 群 数据 ) 的 样品 平均 值 ; 

校正 后 (不 包括 离 群 数据 ) 的 样品 平均 值 ， 

样品 总 数 ( 包 括 离 群 数据 )。 

在 一 组 数据 中 , 离 群 数据 一 般 只 有 少数 几 个 , 当 个 数 太 多 时 就 不 应 是 离 群 数据 。 在 实际 
计算 时 , 令 (ci 一 c)/c 一 20% 一 30% ,由 式 (2-9) 可 求 出 离 群 数 据 的 界限 值 。 此 界限 值 显 然 
与 样品 数 n 有 关 。n 越 大 ,cj 的 偏离 可 能 越 大 ,故此 法 适合 对 小 子 样 的 检验 。 

3, 统计 检验 法 

在 观测 数据 来 自 同一 个 总 体 的 前 提 下 ,统计 检验 法 的 思路 是 检验 数据 是 否 服 从 正 态 分 
布 。 若 通过 检验 , 则 认为 数据 中 不 存在 离 群 数据 ,否则 认为 数据 中 存在 离 群 数据 ,这 时 就 需 
”要 识别 出 其 中 的 离 群 数据 并 对 其 进行 有 关 的 处 理 。 统 计 检 验 的 关键 是 构造 一 个 合适 的 统计 
量 及 其 所 服从 的 分 布 , 在 此 基础 上 确定 相应 的 假设 检验 方法 。 


式 中 ch 


Cl 











C2 





n 
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对 于 来 自 正 态 总 体 的 一 个 观测 数据 z,(G 一 1,2,…，,z) ,将 区 间 ( 一 co ,十 ce) 划 分 为 癌 个 
区 间 : 


(ao yal)y alyaz) 和 Ca lsC，) Cu0 一 一 ceo， 一 十 ce 
设 v; 为 数据 落 人 第 i 个 区 间 内 的 个 数 ( 频 数 ) ,p; 为 数据 落 人 第 i 个 区 间 内 的 理论 概率 。 
假设 日 , :观测 数据 来 自 正 态 总 体 。 
如 果 互 。 为 真 , 由 皮尔 逊 定理 知 , 统 计量 


7 一 > vi — mpi) /mpi) (1 > 3) (2-10) 
i=1 


服从 x%-: 分 布 。 
给 定 检验 水 平 a, 查 x? 分 布 表 得 接受 或 拒绝 昌 , 的 临界 值 y_， (a), 若 7 之 X%-3 (a) , 则 接 
受 假设 Ho ,否则 拒绝 假设 万 ,存在 离 群 数据 。 
在 对 地 质 观测 数据 进行 正 态 检验 时 ,可 将 区 间 (minz， Iaxzi) 均 匀 划 分 为 m 个 区 间 : 
(aoy da) Ca 02) se (a 1 Gm) 
其 中 4 一 1 minzi,an-1 一 0axzi,am 王 十 oo。 区 间 个 数 m 可 随 数 据点 的 增加 而 适 
当 增 加 ,一 般 取 A 10,0.05,0.01 等 。 
《2) 正 态 分 布 的 偏 度 和 峰 度 检验 法 。 
随机 变量 X 的 俩 度 忆 ，、 峰 度 Ej 是 指 X 的 标准 化 变量 (X 一 jv)/o 的 三 阶 中 心 矩 和 四 阶 
中 心 拒 
E, = ElL(x— /ol’, E,; = EL(X—p) /ol 
对 于 观测 数据 z;(i 二 1,2,…,n) ,可 计算 出 该 批 数据 的 偏 度 EE, 、 峰 度 Ej 的 矩 估计 :; 
U,=Us/S, U,=U,/S 


式 中 Us 一 二 了 (zi 一 Zz)* (样本 三 阶 中 心 矩 )， 
i=】 


bp 一 Dz 一 习 4 (样本 四 阶 中 心 矩 )， 






(zi 一 x)* (样本 标准 差 )，; 





-一 
2 = > (样本 数据 平均 值 ) 。 


假设 互 。 :观测 数据 来 自 正 态 总 体 。 
在 H。 为 真 ,由 概率 统计 理论 可 证 , 当 充分 大 时 近似 有 : 
U, ~ N(0,S,), UNG3 一 6/( 十 1),S)) 
S, = 6(n—2)/[ (Cn 1) (nt 3)] 
5 一 242(2 一 2)(1 一 3)7LG2 十 1)202 十 3)(2 十 5)] 
即 
Us/ VS~ NO) [LUr 一 3 二 6/ 十 1)]/ S,/~ N(0,1) 

因此 ,确定 正 态 分 布 偏 度 , 峰 度 检验 方法 如 下 ; 
由 对 观测 数据 z (i 二 1,2,…,n) , 求 出 其 偏 度 和 峰 度 的 矩 估 计 U,,U,， 
@ 对 给 定 的 检验 水 平 a, 求 出 检验 临界 值 ， 
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Bp P,= Zs * WS, +3— 6/(nt1) 
若 |U,| 二 Ps 且 |Uj| 过 Pj;, 则 接受 假设 昌 , ,认为 该 批 数据 服从 正 态 分布 , 否 则 拒绝 假设 


HH, ,认为 该 批 数据 不 服从 正 态 分 布 ,其 中 存在 离 群 数据 ， 


(3) 统计 检验 法 中 离 群 数据 的 界限 ，。 


对 随机 变量 X, 若 其 均值 为 w 方 差 为 所 , 则 由 站 比 雪夫 不 等 式 知 ， 
Pljy—20< X420) 之 0.888 9， Plnu—30<X<u+30) 之 (0， 937 5 


若 随 机 变量 X~NCu0 )， 则 有 : 


Ps 一 2 一 和 < 一 wp 十 20) 之 0.9544， Ply—30<X<pu+30) 之 0.997 4 
因此 ,对 于 观测 数据 zx; (i 二 1,2,…,n) ,可 确定 它 以 大 概率 落 人 区 间 : 

(Zz 一 2S,z 十 2S) 或 (x 一 3S,z 十 35) 
若菜 个 数据 不 在 上 述 区 间 内 , 则 认为 它 是 离 群 数据 ,否则 认为 它 是 正常 数据 。 


4. 对 离 群 数据 的 处 理 


无 论 用 哪 种 方法 识别 出 的 离 群 数据 ,都 要 对 其 进行 处 理 。 常 用 的 处 理 方法 有 三 种 : 
(1) 用 离 群 数据 邻近 的 正常 数据 插值 或 用 某 种 平均 值 代替 离 群 数据 ; 
(2) 将 离 群 数 据 缩放 为 上 述 区 间 的 边界 值 , 即 对 数据 离 群 程度 进行 抑制 ; 


(3) 剔除 离 群 数据 。 


究竟 采用 哪 种 处 理 方 法 ,要 结合 数据 的 实际 情况 而 定 。 


5， 方法 实施 步骤 

以 统计 检验 法 为 例 , 讨 论 对 离 群 数据 的 处 理 
步骤。 由 于 某 些 地 质 观测 数据 的 离散 程度 较 锅 ， 
按 前 述 方法 对 数据 进行 一 次 处 理 后 ,新 的 数据 可 
能 仍 不 能 满足 正 态 分 布 的 要 求 , 这 时 必须 在 新 数 
据 的 基础 上 再 进行 同样 的 处 理 , 反 复 进 行 多 次 ,站 
至 数据 满足 正 态 分 布 为 止 。 因 此 ,可 将 对 离 群 数 
据 的 识别 和 处 理 归 纳 为 一 个 选 代 过 程 。 对 正 态 总 
体 下 的 观测 数据 x (一 1,2,…,z) 处 理 步骤 如 下 : 

(1) 输入 全 部 观测 数据 xi (i 二 1,2,…,n), 给 
定 检验 水 平 Qo 

(2) 在 检验 水 平 a 下 ,对 数据 进行 正 态 分 布 检 
验 (x’ 检验 或 偏 度 、 峰 度 检 验 ) ,大 通过 检验 则 缩 
束 , 否 则 进行 下 一 步 。 

(3) 识别 离 群 数据 并 对 其 进行 相应 处 理 , 形 成 
新 数据 。 

(4) 重复 (2) 一 (3) ,直至 数据 通过 正 态 分 布 检 


验 


计算 机 处 理 离 群 数据 的 流程 如 图 2-3。 













图 2-3 离 群 数据 处 理 流程 图 


铬 一 站 地 质变 时 与 地 岳 数 棍 





思考 与 练 习 
. 什么 是 地 质变 量 ? 地 质变 量 主要 有 哪 几 种 ? 地 质变 量 有 什么 特征 ? 
. 简 述 地 质数 据 的 概念 及 其 分 类 。 
， 地质 数据 有 什么 特点 ? 
. 简 述 地 质数 据 和 矩阵 的 一 般 形 式 。 
. 什么 是 地 质数 据 的 预 处 理 ? 为 什么 要 对 地 质数 据 进 行 预 处 理 ? 
. 简 述 对 地 质数 据 进 行 标准 化 的 常用 方法 、 变 换 公 式 及 变换 后 的 数据 特点 。 
. 态 样 把 定性 数据 转化 为 定量 数据 ? 
. 试 述 对 原始 数据 进行 网 格 化 、 简 缩 和 增补 的 目的 和 方法 。 
. 何谓 离 群 数据 ? 如 何 识别 和 处 理 离 群 数据 ? 
10. 三 个 地 质 园 闭 的 有 关 参 数 观 测 值 构成 混合 型 数据 ( 表 2-3), 试 把 此 混合 型 数据 写成 
答 阵 形式 并 处 理 为 [0,1] 区 间 上 的 定量 数据 。 
表 2-3 ”地 质 团 闭 参数 数据 


, 


tO 0 > 5 





区 贮 埃 学 地 质 





第 三 章 ”回归 分 本 
31 回归 分 析 及 其 解决 的 问题 


一 、 回 归 分 析 

在 地 质 学 研究 领域 ,有 很 多 地 质变 量 之 间 的 关系 是 相互 依赖 和 相互 制约 ,但 又 不 能 用 一 
个 方程 将 它们 之 间 的 变化 关系 表达 出 来 。 变 量 间 的 上 述 关 系 称 为 相关 关系 ,存在 这 种 关系 
的 变量 称 为 相关 变量 ,如 一 个 含油 气 盆地 中 的 油气 资源 量 Q 随 着 盆地 内 生 油 岩 的 体积 Vi、 
储 集 岩 的 体积 V; . 近 油 源 圈 闭 面积 S 的 增 大 以 及 有 机 质 转 化 率 k 的 升 高 而 增多 ,而 随 者 盆 
地 所 经 受 的 剥蚀 次 数 ”的 增多 而 减少 , 即 Q 与 Vi,V;,S,k,n 是 相关 变量 。 

一 般 说 来 , 若 变量 y 与 zi 一 1,2,…,m) 是 相关 变量 ,又 有 它们 的 2 组 观测 值 , 那 么 回 
归 分 析 就 是 根据 相关 变量 的 组 观测 值 ,研究 它们 之 间 的 相关 形式 ,确定 它们 之 间 的 近似 定 
量 关 系 的 一 种 多 元 统计 分 析 方 法 。 

二 、 回 归 分 析 解 决 的 问题 

由 回归 分 析 的 概念 可 知 , 回 归 分 析 的 研究 对 象 是 相关 变量 。 因 此 ,在 回归 分 析 中 应 解决 
变量 间 是 否 存在 相关 性 ,各 变量 间 的 相关 程度 ,相关 形式 等 问题 ,最 终 建立 相关 变量 间 的 近 
似 定量 关系 , 即 统计 意义 上 的 方程 。 


2 多 元 线性 回归 分 析 
一 、 回 归 模 型 与 回归 方程 
知 变 量 y 与 Ti(1—=1 ,2 ,°° ;11) 之 间 具 有 
/ y— a Parite (3-1) 


的 关系 , 则 称 y 与 zx; 之 间 具 有 mm 元 线性 相关 关系 ,简称 为 线性 关系 ,并 称 式 (3-1) 为 线性 回 
归 模 型 ;其 中 do dl 9" sm 为 待定 系数 ,e 是 误差 项 ,并 有 e~N(0,0)。 
假设 bo ,D1 .de , 是 a。 全 1 9 Om 的 最 佳 估 计 值 ,那么 式 (3-1) 可 以 改写 为 


多 一 bo 十 >》 Di (3-2) 


式 (3-2) 叫 做 x; 对 y 的 线性 回归 方程 ,其 中 如 ,1，,… ,65 叫做 回归 系数 ,》 叫 做 y 的 回 
归 值 。 

二 、 确定 回归 系数 

回归 分 析 的 任务 之 一 就 是 确定 回归 系数 。 假 设 已 有 y 和 Zz,(i 二 1,2,…,m) 的 组 观测 


值 


(Zi 9 ok 9 ”人 nk 人 (k= 1,2,.*,7) (3-3) 








入 一 如 十 人 >， (3-4) 
i=1 


确定 回归 系数 的 原则 是 使 观测 值 y; 与 回归 值 分 的 偏 
差 平方 和 





Q, = Sy (3-5) 
达到 最 小 (图 3-1)。 其 中 Q, 是 以 bo ,pb 为 未 知 数 的 
,并 且 Qi>0, 根 理 有 : 
提 汪 线 ia 一 0 oa (3-6) isa 
ab) 
把 式 (3-6) 简 化 整理 得 ， 图 3-1 偏差 示意 图 
a Doz, (3-7) 
D6, = ss (i = 1,2,.,m) z (3-8) 
式 中 加 
呈 一 : TT MTs Siy Dry, Mi 
zx = 1 Dz, ;— 1 Dy 
由 式 (3-8) 解 出 bi.,… ,6b ,再 由 式 (3-7) 解 出 各, 即 可 得 到 回归 方程 式 (3-2) 。 
三 、 回 归 检 验 


回归 检验 解决 的 是 y 与 zx, 之 间 是 否 具有 线性 关系 的 问题 。 为 此 , 先 定义 以 下 几 个 统计 


总 离 差 平方 和 Q EE > (yn — yy) » 
偏差 平方 和 1 Ee Dy — by 9 


回归 平方 和 Q, 一 2 (94 一 3)?。 
可 以 证 明 : 
Q=Q+Q, z (3-9) 
QQ ;Q; 的 目 由 度 fas fo, ;fo, 分别 为 fo=n—1,fo, 二 2 一 12 一 1 ja 一 7 并且 满足 等 
二 
1. 复 相 关系 数 检验 
由 式 (3-9) 可 知 ,Q 越 小 ,Q: 就 越 接近 于 Q, 说 明 变 量 y 与 zx;(i 二 1,2,…,m) 的 线性 关 
. 系 越 密切 ,回归 模型 式 (3-1) 的 偏差 就 越 小 , 即 回归 方程 式 (3-2) 所 代表 的 变化 关系 就 越 接近 
实际 。 根 据 上 述 分 析 , 可 取 Q/Q 作为 衡量 回归 方程 显著 性 的 一 个 指标 。 定 义 
r= (Q,/Q) 


为 变量 ? 写 z,(i 王 1,2,…,m) 的 复 相关 系数 。r 的 绝对 值 越 接近 于 1, 变 量 间 的 相关 性 就 越 
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密切 , 求 得 的 回归 方程 就 越 显 著 。 

2. 下 分 布 检验 

假设 H,:; 变量 y 与 x;(i 二 1,2,…,m) 之 间 没 有 式 (3-1) 给 出 的 线性 关系 。 

车 HH。 为 真 , 那 么 Qi 就 比较 大 ,QQ 就 比较 小 。 当 Qs /Qi 小 于 某 个 临界 值 时 ,就 接受 原 
假设 H ;否则 ,就 否定 原 假设 Ho, 即 变量 y 与 x;(i 一 1,2,… ,1m) 之 间 有 密切 的 线性 关系 。 
可 以 证 明 统 计量 

F= (Q/fo)/(Q /fa) = (Qi/m/ LQ /nm mo 1)] (3-10) 
服从 第 一 自由 度 为 m、 第 二 自由 度 为 (mn 一 m 一 1) 的 下 分 布 。 对 于 给 定 的 检验 水 平 a, 在 
F, 《m,n 一 m 一 1) 分 布 表 上 查 得 临界 值 f,。 当 下 FF 时 ,否定 原 假 设 百 。, 这 时 称 回 归 方 程 是 
显著 的 ,可 以 付 诸 应 用 ;否则 ,接受 原 假设 瓦 。, 即 求 得 的 回归 方程 不 能 应 用 。 

四 、 非 线性 回归 分 析 

变量 间 的 相关 关系 并 非 都 是 线性 的 ,如 兰 石 渗透 率 有 上 与 声波 时 差 人 At、 自然 伽 玛 相 对 值 
AGR 之 间 有 

ng 一 ao 十 alnA 十 arAGR 
的 关系 。 对 于 这 种 情况 , 先 用 变量 奉 换 的 方法 将 其 转化 为 线性 关系 ,然后 再 求 线性 回归 方 
程 。 若 令 


y 二 ln&， r= Ii 六 zs = AGR 
则 上 述 问 题 就 转化 为 
?一 ao 十 aliZi Tax 
的 线性 回归 分 析 了 。 
五 、 回 归 预 测 与 控制 
1. 回归 预测 


所 谓 回 归 预 测 就 是 把 变量 的 给 定 值 Tr (Li=1,2 ,7237 一 1，2,… 2) 代入 式 (3-2)? 求 得 
Yr 的 估计 值 ; 


人 
1 一 1 


当 minxa 世 x 人 maxxa 时 ,y, 落 在 区 间 (》, 一 8 ,分 十 2)，( 轨 一 22 ,十 28) 内 的 概率 分 
别 为 0.68 和 0.95( 图 3-2)。 其 中 





图 3-2 y, 取 值 范围 示意 图 








2.。 控制 

所 谓 控 制 就 是 调整 z， 的 值 ， 使 y 落 在 期 望 区 间 (yi ,wi) 内 。 如 改变 影响 原油 采 收 率 的 
储 层 非 均 质 性 、. 储 层 表 面 润 湿性 . 流 度 比 (驱动 液 流 度 与 被 驱动 液 流 度 的 比值 ) 等 因素 ,使 原 
油 采 收 率 提高 至 某 个 范围 内 ,就 是 控制 的 典型 例子 。 


$3 逐步 回归 分 析 


一 、 逐 步 回归 分 析 的 提出 及 其 基本 思想 

1. 逐步 回归 分 析 的 提出 

(1) 变量 x; 与 y 的 相关 程度 不 同 。 

众所周知 , 生 油层 的 温度 、 电 茂 深度 制约 了 有 机 质 热 注 化 生 油 所 需要 的 演化 时 间 ， 但 它 
们 对 演化 时 间 的 制约 程度 却 不 同 。 根 据 表 3-1 中 的 数据 ; 求 得 生 油 门限 时 间 上 与 生 油 朗 温 
度 T 和 埋藏 深度 日 的 相关 系数 分 别 为 一 0. 662 7 和 一 0. 358 7。 相 关系 数 表明 :有 机 质 向 厂 
油 演化 所 需要 的 时 间 随 着 地 温 的 升 高 和 埋藏 深度 的 加 大 而 缩短 ,其 中 温度 对 演化 时 间 起 着 
主导 作用 。 

表 3-1 18 个 贫 地 (地 区 ) 的 生 油 层 数 据 


序 号 含油 气 盆地 (地 区 ) T/C H/m t/ Ma 
1 杜 阿拉 使 地 (喀麦隆 ) 70 
2 落 山 矶 盆地 (美国 ) 12 
3 文 吐 拉 盆 地 《美国 ) i2 
4 巴 歼 盆 地 (法 国 ) 180 
5 阿 启 坦 盆地 (1)( 法 国 ) 112 
6 阿 启 坦 盆地 (2)( 法 国 ) 135 
7 卡 马尔 圭 盆 地 (法 国 ) 38 
8 阿 尤 恩 地 区 105 
9 苏 绿 海盆 地 (沙巴 ) 12 
10 塔 拉 纳 基 盆 地 (新 西 兰 海上 ) 70 
11 亚马逊 盆地 (委内瑞拉 ) 359 
12 塔 拉 纳 基 爸 地 (新 西 兰 海上 ) 32 
13 东营 盆地 35 
14 湾 江 盆地 35 
15 松 辽 盆地 (1) 110 
16 松 这 盆地 (2) i100 
17 松 辽 盆地 (3) 90 
18 和 辽河 盆地 50 





上 述 实例 表明 ;对 拟定 的 变量 zx;(i 二 1,2,…,m) 来 说 ,它们 与 y 的 相关 程度 不 同 ,对 y 
的 作用 也 就 不 同 ,其 中 很 可 能 有 对 y 不 起 作用 的 变量 ,由 此 提出 了 “筛选 ”对 y 作用 大 的 变 
量 建立 回归 方程 的 逐步 回归 分 析 。 

(2) 变量 间 的 相关 性 。 

地 奈 现象 是 地 质 作用 过 程 合 加 的 结果 。 因 此 描述 地 质 现象 的 变量 zx， (i=1, 2 a 
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既 有 相对 的 独立 性 ,又 存在 着 一 定 的 成 因 联 系 。 对 具有 成 因 联 系 的 一 些 变 量 ,貌似 各 自 对 > 
都 有 不 可 忽视 的 影响 ,但 当 把 其 中 一 个 变量 选 人 回归 方程 后 ,又 使 得 先 选 人 的 另 一 个 变量 对 
y 的 作用 变 得 无 足 轻重 了 。 因 此 ,也 要 对 已 选 入 回归 方程 中 的 变量 进行 逐步 “筛选 ”, 这 是 提 
出 逐步 回归 分 析 的 另 一 个 原因 。 

此 外 ,还 要 考虑 回归 方程 的 简便 和 实用 。 

2. 逐步 回归 分 析 的 基本 思想 

逐步 回归 分 析 的 基本 思想 是 :在 回归 分 析 过 程 中 , 按 变量 zx;(i 二 1,2,…,m) 对 y 作用 的 
大 小 ,把 作用 达到 一 定 程度 的 变量 x,(1 志 rm) 逐 个 “引入 ”回归 方程 ,同时 逐个 检验 已 引入 
回归 方程 的 变量 x, (zx,€x,) 对 y 的 作用 ,如 果 它 对 y 的 作用 已 不 显著 , 则 再 从 回归 方程 中 
“剔除 "z. 。 如 此 进行 下 去 ,直到 既 没 有 对 y 作用 显著 的 变量 可 引入 回归 方程 ,又 没有 作用 不 
显著 的 变量 从 回归 方程 中 “剔除 ?为 止 。 

回归 结束 时 , 若 引 人 的 变量 为 ze ,zu ，… ,zh ; 则 回归 方程 为 ; 

y= bo + be Te TT ba, Ta, 十 十 DT (3-11) 

式 (3-11) 中 就 仅 包 含 了 对 y 作用 显著 的 变量 。 

二 、 变量 x; 对 y 的 作用 及 作用 大 小 的 检验 

在 逐步 回归 分 析 中 ,要 不 断 地 判断 变量 zx; 对 y 的 作用 ,那么 如 何 衡量 变量 zx; 对 y 作用 
的 大 小 呢 ? 为 此 ,需要 构造 一 个 衡量 变量 x; 对 y 作用 大 小 的 指标 以 及 检验 作用 大 小 的 方 
法 。 

1. 衡量 变量 x 对 y 作用 的 指标 

对 于 引入 了 ?各 27 十 1 个 变量 的 回归 方程 来 说 , 参照 式 (3-9) 有 : 

Q= QQ  Q= QQ 

由 上 式 可 得 : 

AQ -= O00 = (3-12) 

式 (3-12) 表 明 ,回归 方程 中 增加 一 个 变量 后 ,导致 回归 平方 和 、 偏 差 平方 和 的 变化 ,并 且 
回归 平方 和 的 增加 量 等 于 偏差 平方 和 的 减少 量 。 通 常 称 AQ 为 第 /十 1 个 变量 对 y 的 方差 
贡献 。 一 般 情况 下 ,变量 zx 的 方差 贡献 记 为 V，, 它 是 衡量 变量 zx 对 y 作用 大 小 的 一 个 指 
标 。 

2， 检 验 变 量 zs 对 y 作用 大 小 的 方法 

(1) 检验 zk 是 否 引 入 回归 方程 。 

假设 昌 , ;变量 x 对 y 作用 不 显著 , 统计 量 

FA = [Ve (ze sx se ;x1 ) /11/[LQ, 0 C918) 
服从 (1,n 一 1 一 2) 分 布 。 其 中 为 样本 容量 (数据 组 数 ) ,! 为 回归 方程 中 的 自 变量 个 数 。 

给 定 检 验 水 平 a, 查 F.(1,n 一 /一 2) 分 布 表 ,得 一 个 临界 值 F。 若 F 之 F,, 则 否定 假设 
H。 , 即 变量 xz; 对 y 作用 显著 ,应 引入 回归 方程 ;否则 ,接受 假设 Ho, 即 不 引入 zx 。 

(2) 检验 zs 是 否 从 回归 方程 中 剔除 。 

假设 妃 , :变量 zs 对 y 作用 不 显著 ,统计 量 

Fs = [Vi (re st oT) 1/[Q (C2 sve sr /RL 1) 
(3-14) 









用 二 着 回归 分 六 
Meme st 


服从 F(1,n 一 /一 1) 分 布 。 

给 定 检验 水 平 a, 查 F,(1,n 一 /一 1) 分 布 表 ,得 一 个 临界 值 F,。 车 F'; > 已 ， 则 否定 假 
设 H,, 即 变量 zx 对 y 作用 显著 ,应 留 在 回归 方程 中 ;否则 ,接受 假设 Ho, 即 从 回归 方程 中 出 
除 变 量 Xho 

三 、 实 现 逐 步 回 归 分 析 的 变换 公式 

逐步 回归 是 在 多 元 回归 的 基础 上 派生 出 的 计算 技巧 , 它 是 通过 对 变量 的 相关 系数 增 广 
和 矩阵 实施 一 系列 惩 阵 变换 来 实现 逐步 引 人 和 剔除 变量 ,求解 回归 方程 。 

1. 相关 系数 增 广 矩阵 

对 变量 进行 标准 差 标准 化 ,并 将 处 理 后 的 新 变量 仍然 记 为 x; (i 二 1,2,…,m 十 1) ,其 中 
的 zw+i 一 y。 对 于 标准 化 变量 ,可 以 证 明 回 妇 系 数 5 满足 方程 组 ， 





Si 一 ro (i= 1,2,",m) : (3-15) 
j=! 
式 中 ri 原始 变量 Ti 与 工 ; 的 相关 系数 。 
把 式 (3-15) 的 系数 抢 阵 增加 一 行 一 列 , 得 相关 系数 增 广 矩 阵 : 
六 1 六 12 站 7 1m 7 1zr: 
7 21 22 oo 7 2m 7 2mtl 
R= 。 
Vnl ?m2 i Tn nd 
六 mr+Hl,1 7 ra1 ,2 让 Vmtl ,rm VT mtl ,intl 


2， 逐步 回归 分 析 的 变换 公式 

逐步 回归 分 析 求 解 回归 方程 就 是 对 矩阵 R 实施 一 系列 的 矩阵 变换 。 设 逐步 回归 已 进 
行 了 NN 步 , 共 引入 了 /个 变量 zi ze ,x 。 它 的 第 N 十 1 步 不 论 是 引 人 还 是 剔除 变量 
Tt， 都 是 按 式 (3-16) 对 和 矩阵 中 的 元 素 进行 一 次 变换 ,得 第 N 十 1 步 的 矩阵 。 


(N) /_(N) a 
ri A i 一 k, » J 天 k, 
CN) CN} (NY /1 CN) ， ， 
(NE1) rs Fi Tj /re 1 k, » J 天 R。 (3 16) 
Fi: 
— yp fAN) pA 
Tis 7 2 天 wx Ko 
(Ny ee 人 
1/ree 1 一 人 .yj = k, 





式 中 rr 六 一 一 R 经 过 第 N 步 变换 后 的 和 矩阵 RN 中 的 元 素 ; 
rt? 一 一 R 经 过 第 NN 十 1 步 变 换 后 矩阵 Row+b 中 的 元 素 。 
四 、 方 差 贡 献 , 偏 差 平方 和 及 回归 系数 
假设 逐步 回归 进行 了 NN 步 ,引信 了 变量 zx ,zx ,… ,zx ,对 应 的 回归 方程 为 ; 
y= OM hz t+ to Nz (3-17) 

1. 方差 贡献 

在 第 N 步 的 基础 上 ,逐步 回归 的 第 N 十 1 步 不 论 是 引入 还 是 剔除 变量 zx 的 方差 贡献 
均 按 下 式 计算 ; 


(N) __ CN) (N) CN) 
ke Fortl,k , re mtl/ 7 


当 V 名 >0 时 ,第 N 十 1 步 是 引入 变量 xx ; 当 Vgm <0 时 ,第 N 十 1 步 是 剔除 变量 x 。 
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2. 偏差 平方 和 与 回归 平方 和 
第 N 步 回 归 方 程式 (3-17) 的 偏差 平方 和 与 回归 平方 和 分 别 为 : 


{N} _. _(N) CN) CN) 
QQ! Ft] 4 Gu 一 1] 六 HL ,wetl 


3， 回归 系数 和 复 相 关系 数 
回归 方程 式 (3-17) 的 系数 和 复 相 关系 数 为 : 
ON 一 2) 
R 二 (1 = er ju 
最 后 指出 ,逐步 回归 分 析 不 仅 能 够 从 拟定 的 变量 中 “筛选 ?作用 大 的 变量 建立 回归 方程 ， 
而 且 能 够 辅助 确定 变量 间 的 相关 形式 。 
五 、 逐 步 回归 分 析 流 程 
总 结 逐 步 回 归 分 析 的 计算 过 程 ,给 出 计算 流程 图 (图 3-3)。 


输入 xy (Ci=1,2,… ,m+1;k=1,2,.…,n) 
并 引入 和 剔除 变量 的 临界 值 


计算 相关 系数 增 广 符 阵 


计算 不 在 回归 方程 中 的 所 有 变量 的 
方差 贡献 , 其 中 最 大 者 为 所 








检验 pe 对 应 N 
变量 是 否 引入 


Y 
变换 相关 系数 增 广 矩阵 














计算 在 回归 方程 中 的 所 有 变量 的 
方差 贡献 ,其 中 最 小 者 为 内， 


N 检验 内 对 应 
变量 是 在 剔除 
Y 


变换 相关 系数 增 广 矩阵 


3-3 ”逐步 回归 分 析 流 程 图 


$4 应 用 实例 


【 例 113 有 利 含 油气 面积 预测 。 
(1) 生 油门 限时 间 法 。 


[ET 
| 有 和 时 | | di 









镶 三 通 狠 归 分 析 


据 表 3-1 中 盆地 生 油层 数据 ,以 埋藏 深度 互 . 生 油层 温度 工 为 自 变量 ,以 生 油门 限时 间 
的 自然 对 数 ln t 为 因 变 量 , 求 得 如 下 回归 方程 : 
Int =7585/(T+273)—2 370/H—15.0 

该 回归 方程 的 复 相关 系数 等 于 0. 94, 即 回归 方程 显著 。 在 已 知 生 油 层 温度 和 埋藏 深度 
的 条 件 下 ,利用 上 述 回归 方程 可 以 预测 生 油 层 温度 为 T .埋藏 深度 为 日; 的 生 油 门限 时 间 
;, 。 因 此 , 生 油 门限 时 间 回 归 方 程 给 我 们 提供 了 一 种 追踪 生 油 面积 的 找 油 途 径 ,也 就 是 说 ， 
用 生 油 层 埋藏 时 间 与 生 油门 限时 间 回 归 方 程 预测 的 生 油 时 间 之 差 绘 制 偏差 等 值 线 图 ,图 上 
的 正 偏差 区 意味 着 有 机 成 熟 区 , 它 是 有 利 的 勘探 地 区 。 

(2) 含油 面积 系数 法 。 

陈 立 平 . 陈 子 恩 等 利用 构造 因素 、 沉 积 因素 、 
生 油 因素 对 含油 面积 系数 (单元 中 累计 产 油 超过 
1 t 的 油井 数 与 总 井 数 之 比 ) 进 行 回归 分 析 , 并 利用 
得 到 的 回归 方程 预测 了 四 川 盆 地 侏 罗 系 自 流 井 群 
大 安 寨 组 的 含油 面积 系数 ,绘制 了 含油 面积 系数 
预测 图 (图 3-4, 图 中 数字 为 百分数 ) 。 在 此 基础 上 
确定 了 有 利 含 油 面积 ,为 油气 资源 评价 提供 了 重 
要 依据 。 
基本 思路 :把 评价 区 划分 为 10 kmX10 km 的 〖e 
675 个 单元 ,统计 每 个 单元 上 反映 沉积 .构造 . 生 油 卜 
三 个 方面 的 15 项 地 质 参数 及 含油 面积 系数 。675 
个 单元 中 的 139 个 单元 有 钻探 资料 ,另外 还 有 11 
个 边界 控制 单元 ,共计 有 150 个 单元 。 根 据 150 个 图 3-4 四 川 盆地 侏 罗 系 自流 并 群 
单元 的 数据 , 取 引 入 与 剔除 变量 的 临界 值 均 为 大 安 寨 组 含油 面积 系数 预测 图 
2. 5 ,建立 地 质 参 数 对 含油 面积 系数 的 回归 方程 。 

QD 地质 参 数 。 
关 一 一 大 安 寨 组 底面 构造 七 次 趋势 剩余 值 ,mi: 
zs- 时 第 三 纪 前 大 安 寨 组 底面 古 构造 六 次 趋势 剩余 值 ,m: 
zs 一 一 大 安 寨 组 底面 现今 构造 海拔 高 度 ,ms 
Xz4 一 一 时 第 三 纪 前 大 安 寨 组 底面 古 构造 六 次 趋势 值 ,m，。 
Xs 一 一 介 悄 灰 岩 ,页 尝 沉 积 葛 律 数 ， 
zs 一 一 页 岩 厚度 / 介 悄 灰 岩 厚度 ,%， 
Zz; 一 一 (页 岩 厚度 十 介 悄 灰 岩 厚度 )/ 组 厚度 ,%; 
沉积 条 件 / zs 一 一 (页 岩 厚度 /组 厚度 )X( 介 必 灰 岩 厚度 /组 厚度 ) (小 数 ); 
Xt 一 一 页 央 厚度 ,m; 
2Z1 一 一 介 恨 灰 关 厚度 9 II 
zu 一 一 介 导 灰 岩 单 层 平均 厚度 » II 
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zo 一 一 有 机 质 成 熟 度 时 间 温 度 指 数 (TT7; 
zu 一 一 单位 面积 生 油 量 ,t/km' ; 
生 油条 件 ” 单位 体积 生 油 量 ,t/km; 
y 一 一 含油 面积 系数 ,%。 
@ 建立 回归 方程 。 2 
进行 逐步 回归 分 析 , 共 引入 七 个 变量 ,得 到 回归 方程 ; 
Sy = 10*(2. 64xi + 6. 82x: 一 2.08rs — 3, 40z4) 十 
10-3(7. 14xs + 8. 442zx;) 十 102 X 2.861ze 十 0.781 
引信 参数 的 组 合 反 映 大 安 寨 组 具有 受 构造 , 岩 性 、 岩 相 控 制 的 裂缝 性 油 藏 的 特点 。 
【 例 2 油气 资源 量 预测 。 
(1) 油气 地 质 条 件 法 。 
勘探 实践 表明 ,含油 气 四 陶 中 单位 面积 的 油气 储量 与 油气 地 质 条 件 ( 生 , 储 、 盖 、 立 \ 保 ) 
有 着 密切 的 关系 。1985 年 2 月 ,朱子 仁 等 利用 我 国 东 部 地 区 一 些 勘探 程度 较 高 的 含油 气 由 
陷 的 实际 资料 ,建立 的 油气 地 质 条 件 对 探 明 储量 的 回归 方程 为 : 
y = 0.136zi 十 0.729z; 十 0.356zxs 十 0.152z 一 0.12N 一 5.37 
式 中 ”3 一 一 单位 面积 的 油气 储量 ,10* t/km; 
Tz! 一 一 生 油 岩 体积 与 沉积 岩 体 积 之 比 ( 生 油条 件 ) ,2 ; 
za 一 一 有 机 质 转化 率 ( 生 油条 件 ),%%; 
Xs 一 一 储 集 岩 体积 与 沉积 岩 体 积 之 比 ( 储 、 盖 条 件 ),%; 
xz4 一 一 近 油 源 圈 闭 面 积 与 沉积 岩 面 积 之 比 ( 轿 闭 条 件 ),%; 
N 一 一 含油 气 凹 陷 所 经 历 的 剥蚀 次 数 (保存 条 件 ) 。 
油气 储量 为 中 值 , 其 置信 区 间 为 y 士 2S。 
采用 概算 储量 得 到 回归 方程 ， 
y 一 0.835xi 十 0.597z; 十 0.269zs 十 0.142z, 一 0.05N 一 6.654 
利用 概算 储量 回归 方程 ,预测 前 梨园 洼 陷 沙 二 下 段 460 km? 内 的 石油 资源 总 量 为 : 
>)Q= 28.834 XxX 460 = 13 263.64(104 t) 
(2) 石油 资源 丰 度 法 。 
回归 方程 的 内 洱 取 决 于 拟定 的 地 质变 量 。 若 把 影响 石油 资源 丰 度 的 主要 地 质 因素 拟定 
为 烃 源 岩 的 生 烃 强度 、 储 层 的 发 育 程 度 、 烃 源 岩 上 和 履 地 层 区 域 不 整合 面 个 数 和 评价 单元 的 图 
闭 面 积 系数 等 ,根据 实际 资料 建立 的 地 质 因 素 对 石油 资源 丰 度 的 回归 方程 ( 据 赵 文智 主编 
《石油 地 质 理论 与 方法 进展 》,2006 ) 为: 
y 一 0.042zri 一 9. 369zs 十 0. 297zr, 十 2.910er"ttsn -5.688 
了 式 中 yy 一 一 石油 资源 丰 度 ,10 t/ km  ; 
zi 一 一 烃 源 岩 生 烃 强 度 ,104 t/km?， 
xs 一 一 储 层 厚度 与 沉积 岩 厚 度 之 比 , %， 
Xs 一 一 圈 闭 面积 系数 ,%; 
ZX4 一 一 不 整合 面 个 数 。 





(3) 体积 速度 法 。 








1975 年 开 . HI. Hecmepos 根据 世界 22 个 勘探 程度 较 高 的 会 油气 盆地 的 资料 ,统计 得 出 
油气 总 资源 量 (换算 成 油 的 地 质 铺 量 ) 与 盆地 沉积 速度 站 1024 
关系 为 ， 512 

lg Q= 2.813 二 1.6131lgV 256 
式 中 QQ 一 一 油气 地 质 储 量 , XX 10" ti 128 
V 一 一 沉积 物 充填 的 平均 体积 速度 ,10” km /Ma。 

22 个 盆地 分 为 四 类 (图 3-5); 

T 类 :波斯 湾 . 墨 西 哥 湾 西西 伯 利 亚 等 ,其 平均 体积 
速度 大 于 14X10 km’;/Ma; 

[类 :伏尔加 -乌拉 尔 、. 马 拉 开 波 .南里 海盆 地 等 ,其 平 
均 体 积 速度 为 (4 一 14) X103 kms /Ma 

亚 类 :二 释 盆 地 、 圣 华 金 盆地 、 切 尔 斯 - 克 里 海 等 ,其 平 i 
均 体积 速度 为 (1. 5~4) X10 km /Ma; 93 1 04 15 54 25.5 

时 类 ; 多 是 些小 分 地 ,如 维也纳 、 伊 里 诺 斯 、 密 执 安 倪 谷地 沉积 速度 / (x 108 km Ma) 
地 、 亚 速 夫 - 库 班 . 丹 佛 、 泡 德 河 、 维 灵 斯 顿 等 倪 地 ,其 平均 
体积 速度 小 于 1.5X10 ”km /Ma。 

【 例 3] 参数 预测 。 

(1) 油 气 运 移 聚 集 系 数 预测 。 

油气 运 移 聚 集 系数 是 成 因 法 估算 油气 资源 量 的 关键 参数 。 在 中 国 石 油 第 三 次 资源 评价 
中 ,对 38 个 资源 探 明 程度 相对 较 高 的 油气 聚集 单元 进行 剖析 ,获得 了 油气 成 藏 条 件 定量 措 
述 参数 和 油气 运 移 聚 集 系 数 等 重要 参数 。 在 此 基础 上 分 析 .研究 了 油气 成 藏 地 质 因 素 与 油 
气 运 移 聚 集 系 数 的 关系 ,采用 逐步 回归 分 析 方 法 ,建立 的 油气 运 移 聚 集 系 数 预测 模型 ( 据 赵 
文智 主编 《石油 地 质 理论 与 方法 进展 》,2006) 为 ， 

ln y 一 1.478 一 0.003 18xl 十 0.186zs 一 0. 1127zs 十 0.021 187z4 
式 中 y 一 一 石油 运 移 聚 集 系数 ,%% ; 
x! 一 一 烃 源 岩 年 龄 ,Ma; 


站 
srs/ 0 


油气 地 质 储 量 (给 定单 位 ) 


3.2 12.851.2 





图 3-5 油气 原始 地 质 储量 与 
沉积 充填 平均 体积 速度 











xz 一 一 图 闭 面 积 系数 ,2%。 
(2) 测 井盖 层 突 破 压力 预测 。 
泥 质 盖 层 封闭 能 力主 要 反映 在 两 个 方面 :一 是 微观 封闭 能 力 的 强 弱 ;二 是 宏观 展 布 范 
图。 根据 盖 层 阻止 油气 运 移 的 方式 ,可 把 盖 层 的 微观 封闭 机 理 分 为 毛细 管 力 封闭 、 异 毅 压力 
封闭 和 浓度 封闭 。 对 毛细 管 力 封闭 机 理 而 言 , 泥 质 盖 层 的 突破 压力 是 评价 的 关键 参数 。 测 
井 资料 计算 突破 压力 是 通过 测 井 计算 的 总 孔隙 度 和 有 效 筷 际 度 进行 的 。 
由 苏丹 Muglad 盆地 岩心 与 测 井 资料 回归 的 突破 压力 方程 ( 据 方 朝 亮 主编 《勘探 开发 集 
成 配套 技术 及 应 用 实践 》,2006 ) 为 ， 
po, = eg 
pa, =— 200¢. + 224. 36 
式 中 p。 一 一 总 孔隙 度 计算 的 泥 质 盖 层 突破 压力 ,MPa; 
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9: 一 一 泥 质 盖 层 的 总 孔隙 度 , 2; 
ki 一 一 经 验 系数 , 当 gp 之 20% 时 和 二 一 0.2; 当 9. 二 20% 时 ,二 一 0, 22; 
ps 一 一 有 效 和 孔隙 度 计算 的 泥 质 盖 层 突破 压力 ,MPa; 





泥 质 盖 层 的 有 效 孔 隙 度 ,%%。 
思考 练 习 


. 简 述 回归 分 析 的 基本 概念 和 研究 对 象 。 

什么 是 多 元 线性 回归 模型 .回归 方程 ? 如 何 拟定 回归 模型 ? 

. 简 述 最 小 二 乘法 确定 回归 方程 系数 的 基本 原理 。 

,简要 归纳 多 元 线性 回归 分 析 的 计算 步骤 。 

. 简 述 回归 方程 显著 性 的 检验 方法 及 其 含义 。 

.如 何 求 非 线 性 回归 方程 ? 

， 简 述 逐 步 回归 分 析 的 基本 思想 。 

， 结 合 专 业 知 识 总 结 回 归 分 析 在 地 质 研究 和 油气 勘探 中 的 应 用 。 


| ， 镜 质 体 反 射 率 RR, 是 衡量 生 油 岩 成 熟 度 的 一 个 常用 指标 ,其 观测 值 的 平均 值 RR, 与 生 
油 岩 的 埋藏 深度 互 之 间 有 


Oe 


中 


R, 一 Wo 十 aH 十 e 
的 关系 。 现 有 沾 化 凹陷 的 一 批 日 以 及 与 之 对 应 的 尺 ,的 观测 值 数 据 ( 表 3-2), 试 求 日 对 RR。 
的 回归 方程 ,并 对 回归 方程 进行 显著 性 检验 ，。 
表 3-2 沾 化 凹陷 镜 质 体 反 射 率 平均 值 与 生 油 岩 埋 藏 深度 数据 
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第 四 昔 ” 聚 类 分 析 
NI 聚 类 分 析 与 聚 类 统计 量 


一 、 始 类 分 析 

地 质 学 中 有 很 多 分 类 研究 的 问题 ,如 沉积 岩 、 古 生物 .矿物 .油气 藏 , 油 气 地 球 化 学 勘探 
指标 的 分 类 是 一 些 直接 分 类 的 例子 ;油气 资源 评价 . 油 源 对 比 等 是 间接 分 类 研究 的 问题 ;地 
层 划 分 属于 另 一 种 分 类 。 为 了 叙述 方便 ,在 此 将 分 类 的 具体 目标 统称 为 样品 (或 变量 ) 。 聚 
类 分 析 是 根据 样品 (或 变量 ) 之 间 的 亲 朴 程度 ,将 样品 (或 变量 ) 进 行 逐 级 定量 分 类 的 一 种 多 
元 统计 分 析 方 法 。 根 据 分 类 的 基本 原理 , 聚 类 分 析 可 分 为 聚合 法 和 分 解法 。 

1. 聚合 法 聚 类 分 析 

某 地 区 油气 地 表 化 探 样 品 具有 14 项 指标 , 按 指标 间 的 相关 程度 分 类 , 若 取 相 关系 数 为 
0.75, 可 把 指标 分 为 三 类 ,最 终 以 0. 07 的 相关 程度 合并 为 一 类 (图 4-1) 。 在 此 基础 上 给 出 
聚合 法 聚 类 分 析 的 一 般 概念 。 

案 合 法 聚 类 分 析 又 称 为 点 群 分 析 , 它 是 按 | 
样品 (或 变量 ?在 性 质 (成 因 ) 上 的 亲 芯 关系 ,把 。。。1 相关 系数 
样品 (或 变量 ) 进 行 逐 级 定量 分 类 的 一 种 多 元 统 090 7 
计 分 析 方 法 。 这 种 聚 类 分 析 , 开 始 时 每 个 样品 we 4 
(或 变量 ) 自 成 一 类 ,然后 以 某 种 表示 样品 (或 变 088 。 

量 ) 间 亲 朴 关系 的 统计 量 ( 分 类 指标 ) 为 分 类 依 "5 3 
据 , 先 把 彼此 关系 最 密切 的 样品 (或 变量 ) 合 并 093 8 

为 一 类 ,再 把 关系 相对 亲近 的 小 类 (一 个 或 多 个 10 

样品 (或 变量 )) 合 并 成 一 类 …… ,直到 所 有 的 样 100 ”1 

品 ( 或 变量 ) 合 并 成 一 个 大 类 为 止 。 最 终 的 分 类 1% 12 

结果 是 一 幅 反 映 样品 (或 变量 ) 间 的 差异 和 亲 朴 141 

关系 (由 细 分 类 到 粗 分 类 ) 的 定量 分 类 系统 图 4-1 油气 地 球 化 学 勘探 指标 聚 类 谱系 图 
图 聚 类 分 析 谱 系 图 (图 4-1)， 1,2,… ,14 为 修整 指标 编号 

研究 样品 的 相似 性 ,对 样品 的 分 类 又 称 为 
Q 型 聚 类 分 析 ; 而 研究 变量 的 相关 性 ,对 变量 的 分 类 则 叫做 R 型 诊 类 分 析 。 

聚合 法 聚 类 分 析 中 的 样品 (或 变量 ) ,如 油气 藏 . 沉 积 岩 ,地球 化 学 勘探 指标 之 间 没 有 次 
序 约束 关系 。 

2. 分 解法 聚 类 分 析 

从 分 类 原理 上 讲 , 这 种 聚 类 分 析 与 聚合 法 聚 类 分 析 恰好 相反 ,开始 时 全 部 样品 为 一 个 大 
类 ,依据 某 种 分 类 指标 ,把 全 部 样品 分 为 两 类 ,三 类 ……, 直到 满足 分 类 的 要 求 为 止 。 例 如 ， 
假设 数列 {1,1,2,2,3,3} 是 六 个 样品 某 个 变量 的 观测 值 ,根据 观测 值 的 相似 性 ,把 六 个 样品 
分 为 三 类 ,结果 是 {1,2) ,{3,4),{5,6}。 因 此 ,分 解法 聚 类 分 析 是 把 大 类 分 解 成 小 类 的 统计 
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分 析 方 法 。 
分 解法 聚 类 分 析 中 的 样品 之 间 有 次 序 约 束 关 系 , 如 沿 着 地 层 剖 面 依次 取 若 干 块 岩石 样 
品 , 右 将 样品 的 分 类 结果 用 于 地 层 划分 或 者 岩 性 识别 ,那么 分 类 时 样品 的 排列 顺序 就 不 能 打 


2 


二 、 聚 类 统计 量 

聚 类 统计 量 是 衡量 分 类 对 象 相 似 ( 相 关 ) 程 度 的 统计 指标 。 在 此 介绍 几 个 最 常用 的 聚 类 
统计 量 。 

1. 聚合 法 聚 类 统计 量 

假设 有 7 个 样品 ,每 个 样品 有 m 个 变量 ,它们 的 观测 值 Ti(z 一 27 一 1 2 ， 
7) 构 成 一 个 数据 矩阵 , 记 为 : 


X11 Xl2 叱 1m 
TL21 X22 "Xam 
是 xm = (4-1) 
三 量 理 时 达 重 


由 式 (4-1) 可 以 看 出 ， 

Q 和 矩阵 的 行 元 素 是 样品 的 观测 值 , 可 将 其 视 为 六 维 空间 的 一 个 点 或 一 个 矢量 。 

凶 和 矩阵 的 列 元 素 是 变量 的 次 观测 值 , 可 将 其 视 为 维 空间 的 一 个 点 或 一 个 矢量 。 

由 上 可 知 ,样品 间 的 相似 性 就 是 数据 答 阵 中 行 之 间 的 相似 性 ,Q 型 聚 类 就 是 把 数据 
矩阵 中 相似 程度 高 的 行 合并 为 同类 ; ;变量 间 的 相关 性 就 是 数据 矩阵 中 列 之 间 的 相关 性 ,R 型 
案 类 就 是 把 数据 和 矩阵 中 相关 程度 高 的 列 合 并 为 同类 。 在 此 基础 上 ,给 出 聚合 法 聚 类 统计 量 。 

(1) Q 型 聚 类 分 析 统 计量 。 

由 相似 系数 。 

设 天 量 书 一 (zyzp 11 定义 不 与 下 ; 坎 角 6 的 余 荡 为 时 
与 XX; 的 相似 系数 , 即 : 


ri; 一 cos 0; 二 DE (1 /> Si ) (zi = 1,2," ,1) 
k=1l k=1 


(4-2) 
在 和 矩阵 (x; ),x; 中 ， Fo ,7 一 ]。 rj 越 接 近 于 ] ,XX;, 关 ， 的 性 质 越 相 近 。 
他 相关 系数 。 
定义 矢量 万 与 局) 的 相关 系数 为 : 


# t x 一 i) i = 入 二 > ” 7) 一 2 
2 0 | JD a > (i,7] 二 1,2 nt) 


(4-3) 
在 矩阵 (x; ),xs 中 ,rj 二 xi; ,ri 二 1 o 5 越 接 近 于 1 ,六 ;, ,XX 的 性 质 越 相 近 。 
G) 距离 系数 。 
在 m 维 空间 中 ,两 个 点 之 间 的 距离 为 : 


ds 下 [过 (za | (zy7 二 1] ,2,°..,n) 
k=1 
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为 了 防止 dj 过 大 而 造成 计算 溢出 ,把 上 式 改写 为 ， 
1 2 0 p | 一 吉 韦 虽 = 
一 2 党 奸 》 | (i1,7 = 1 ,2,， ,72) (4-4) 


在 矩阵 (ai ),x: 中 ,ds 一 di ,di 二 0 。d; 越 接近 于 0,X,,X 的 性 质 越 相近 。 

(2) R 型 聚 类 分 析 统 计量 。 

如 前 所 述 ,变量 间 的 相关 性 是 数据 和 矩阵 中 列 之 间 的 相关 性 。 因 此 ,仿照 Q 型 聚 类 统计 
量 , 并 设 矢 量 是 ;一 (人 ZU Tais 9 Tm ) 如 (Ty) 2 9 ) , 易 写 出 R 型 聚 类 分 析 统 计量 ， 

中 相似 系数 。 


XX ~ 


ee == J 2 (4-5) 
在 矩阵 (rs)%xmn 中 ,rj 二 7; ,ri 二 1 o Fi 越 接近 于 ] ,XX,,X, We 
G 相关 系数 。 


= Dre acey —5)] ( Se 的 
央 一 1 


(1,7 一 = 上 ,2 (4-6) 
在 矩阵 (rj ) 5xs 中 ,ry 二 rj ,ri 二 1 o rj 越 接 近 于 ] , XX， 与 入 | 人 
G) 距离 系数 。 


一 上 = (1,7 = 1,2,",m) (4-7) 
在 矩阵 (du )wxw 中 ,an 一 dr oadi 一 0。 d; 越 接 近 于 4， 入; 与 系 ， 相关 越 密切 。 
2， 分 解法 聚 类 统计 量 
设 有 个 样品 ,每 个 样品 有 mm 个 变量 ,它们 的 观测 值 Zi (i—=1,2, nj =1,2,.,m) 
构成 数据 矩阵 式 (4-1)， 


分 解法 吝 类 分 析 的 实质 是 找 出 数据 矩阵 中 数据 的 变化 界线 ,把 数据 矩阵 分 段 。 若 把 它 
分 成 上段, 每 段 内 有 nC 一 1,2,…,k) 个 样品 ,分 段 结 果 记 为 ， 


(1) 42) 和 {mm} {1) {2} Ca) (1) (2) 《me 


11 之 1 ”Xl 21 TT?] X21 El kl ”Tk 
《1) (2) a Cm) 《1) (2) a tm) (1) (2) Sd (1) 
12 之 12 Ti2 元 22 ty2 29 Tk? CR? Tb? 
(C1) (2) i Cm) (1) (2) a Cn) (1) 2) ne Cm) 
二 lm In Tn TL2n, A2n, Ton, Xn 光 铝 ， Tn, 
第 1 段 第 2 段 "+ 第 & 段 


把 数据 矩阵 分 为 大 段 , 有 不 同 的 分 法 。 对 于 其 中 的 任何 一 种 分 法 ， 
总 离 差 平方 和 ， 


S = DS, 一 Zz 站 )? (为 一 常数 ) (4-8) 
段 内 离 差 平方 和 ， 
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段 间 离 差 平方 和 : 
k 天 ne 上 Li 
8 = Da z= mT 一 并 (4-10) 
[一 1 j=1 i= 1 一 1 一 1 
1 了 
式 中 nn 一 一 样品 的 总 数 , n 二 >》jyn; 








x 


此 n 
ee 和 1 二 
第 i 个 变量 n 个 观测 值 的 平均 值 , Zz?” = 一》 Dx? 一 二 mizgn ， 


zp 一 一 第 1 段 内 第 j 个 样品 第 i 个 变量 的 观测 值 。 
可 以 证 明 ， 
9S 一 91 十 9; 
对 于 给 定 的 数据 矩阵 来 说 , S 是 一 个 常数 , 故 Si 小 ,Ss 就 大 。 因 此 ,可 以 把 S; 作为 分 
解法 聚 类 分 析 的 聚 类 统计 量 。 它 的 内 涵 是 ;Si 越 小 ,各 段 内 数据 的 离 差 越 小 (各 段 内 样品 的 
差异 越 小 ) ,而 各 段 之 间 数 据 的 离 差 越 大 (各 段 之 间 样 品 的 差异 越 大 )。 


3 2 聚合 法 聚 类 分 析 


如 前 所 述 ,聚合 法 聚 类 分 析 是 将 样品 (或 变量 ) 的 类 由 多 变 少 ,直到 把 全 部 样品 合并 成 一 
类 的 定量 分 类 方法 ,其 聚 类 过 程 大 致 如 下 : 

QD 原始 类 ,每 个 样品 (或 变量 ) 自 成 一 类 ,这 时 类 的 数目 等 于 样品 (或 变量 ) 的 个 数 。 

@ 第 一 级 聚 类 。 据 某 一 种 统计 量 计算 各 个 样品 (或 变量 ) 之 间 的 亲 玲 程度 ,把 关系 密切 
的 样品 (或 变量 ) 合 并 成 一 类 ,并 将 该 类 改造 成 一 个 代表 性 样品 (或 变量 ) 参 加 下 一 级 聚 类 ， 

@ 第 二 级 聚 类 。 再 计算 样品 (或 变量 ) 间 的 亲 政 程度 ,把 关系 密切 的 样品 (或 变量 ) 合 并 
为 一 类 (样品 (或 变量 ) 与 样品 (或 变量 ) 或 样品 (或 变量 ) 与 小 类 合并 ) ,并 将 该 类 改造 成 一 个 
代表 性 样品 (或 变量 ) 参 加 下 一 级 聚 类 。 

@ 按 上 述 方法 进行 第 三 级 聚 类 .第 四 级 聚 类 …… ,直到 全 部 样品 (或 变量 ) 合 并 为 一 个 
大 类 为 止 。 

在 上 述 聚 类 过 程 中 ,要 不 断 地 计算 样品 (或 变量 ) 与 样品 (或 变量 ) .样品 (或 变量 ) 与 类 、 
类 与 类 之 间 的 亲 琉 程度 ,下 面 介 绍 计 算 它 们 之 间 亲 芒 程 度 的 递 推 公 式 和 育 类 过 程 。 

一 、 距 离 类 统计 量 聚 合法 

对 于 m 维 或 维 空间 的 两 个 点 来 说 ,两 点 间 的 距离 是 两 点 间 线 段 的 长 度 。 但 是 ,两 类 
间 的 距离 就 有 不 同 的 定义 , 既 可 把 两 类 中 相距 最 近 的 两 个 点 ,又 可 把 两 类 中 相距 最 远 的 两 个 
点 之 间 的 距离 作为 两 类 间 的 距离 ,还 可 以 取 两 类 的 重心 距离 作为 两 类 间 的 中 离 等 (图 4-2) 。 
因 距 离 的 定义 不 同 ,也 就 产生 了 不 同 的 聚合 法 。 下 面 介 绍 四 种 距离 度量 集合 法 。 

1. 最 短 距 离 法 

(1) 最 短 距离 。 ee 

如 果 类 p 与 类 g 合并 为 类 7r ,那么 定义 类 p. 类 g 间 : pp 
的 最 短 距 离 为 : 、 





图 4-2 类 间距 离 示 意图 









姥 四 骤 到 类 分 入 


Ds; = mind; (4-11) 
式 中 4d, 类 .类 g 中 的 样品 (或 变量 ) 点 x 与 x; 间 的 距离 。 
最 短 距离 下 的 合并 分 类 叫做 最 短 虐 高 法 聚 类 。 计 算 新 的 类 7 与 某 类 f 之 间 景 短 虐 离 的 
递 推 公式 为 ， 


D,y = (Dy Da) 也 | 有 万 二 D, | (4-12) 


(2) 最 短 踢 离 法 聚 类 的 基本 过 程 。 

中 准备 工作 ， 

计算 初始 的 茵 离 矩 阵 D'”。 对 于 样品 ,D'” 一 (Cd 六 ),xn; 对 于 变量 ,DY 二 (4d ) wxw。 

@ 第 一 级 聚 类 。 

把 D" 中 最 短 距 离 对 应 的 类 合并 为 类 rr。 按 式 (4-12) 计 算 类 7 与 其 他 各 类 的 最 短 距 高 
矩阵 , 记 为 D"，。 

第 二 级 聚 类 ， 

把 D” 中 最 短 距 离 对 应 的 类 合并 为 类 有 。 按 式 (4-12) 计 算 类 与 其 他 各 类 的 最 短 距 离 
和 矩阵, 记 为 D2，。 


重复 上 述 计算 过 程 , 直 到 全 部 样品 (或 变量 ) 聚 为 一 个 大 类 为 止 。 
2. 最 长 距离 法 
(1) 最 长 距离 。 
如 果 类 p 与 类 g 合并 为 类 -~, 那 么 定义 类 pp、 类 g 间 的 最 长 距离 为 : 
D, = max ds (4-13) 
ns 
式 中 4 一 一 类 p、 类 g 中 的 样品 (或 变量 ) 点 zx; 与 zj 间 的 距离 。 
最 长 距离 下 的 合并 分 类 叫做 最 长 距离 法 聚 类 。 计 算 新 的 类 与 某 类 了 之 间 最 长 距离 的 
递 推 公式 为 : 
D,r = (Dn 十 Dp) 十 亏 | D,, 一 也 7 | (4-14) 
(2) 最 长 距离 法 聚 类 的 基本 过 程 。 
最 长 距离 法 限 类 的 基本 过 程 与 最 短 距 离 法 基本 相间 ,不 同 之 处 是 按 式 (4-14) 计 算 最 长 
距离 矩阵 ,并 按 最 长 距离 合并 类 。 
3， 类 平均 法 
(1) 类 平均 距离 。 
如 有 果 类 p 与 类 g 合并 为 类 7 ,那么 定义 类 p、 类 g 间 的 平均 距离 为 ; 
Ds = -i ya, (4-15) 


NpTlg, ep 
Eq 


式 中 4d; 一 一 类 p. 类 4g 中 的 样品 (或 变量 ) 点 xi 与 x) 间 的 距离 ， 
np 一 一 类 pp、 类 gq 中 的 样品 (或 变量 ) 数 ,类 7 中 的 样品 (或 变量 ) 数 ,二 nn, 十 n,。 
在 类 平均 距离 下 进行 的 聚合 依 类 叫做 类 平均 法 。 计 算 新 类 7 与 某 类 j el 











D,, = DD (4-16) 


《2) 类 平均 法 聚 类 的 基本 过 程 。 
类 平均 法 聚 类 的 基本 过 程 与 上 述 聚 类 过 程 类 似 , 不 同 之 处 是 计算 类 平均 距离 矩阵 。 
4， 重心 法 
假设 类 p、 类 gq 的 重心 分 别 是 X,,X, ,那么 类 p 与 类 g 间 的 重心 距离 为 : 
DD 一 dx ,x, (4-17) 
类 p 与 类 g 合成 新 类 > 后 ,新 类 > 的 重心 为 ; 
元 = nsXs + noX,) 

计算 新 类 7 与 某 类 f 之 间 重 心 距离 的 递 推 公式 为 : 

D,, = -0 十 DD” DS (4-18) 
用 重心 距离 进行 的 聚合 聚 类 叫做 重心 法 聚 类 ， 
二 、 相关 类 统计 量 聚合 法 


相关 类 统计 量 包括 相关 系数 .相似 系数 。 相 应 的 聚合 法 有 近邻 连接 法 . 远 邻 连接 法 和 类 
平均 法 。 计 算 新 类 与 某 类 f 之 间 相关 类 统计 量 的 相应 递 推 公式 为 ; 





1. 近邻 连接 法 
R 一 到 (Ra +R,) 十 亏 |Rn —R, | (4-19) 
2. 远 令 连接 法 
Rj ~ F(Rs+Ra)—z|R; — Ra (4-20) 
3， 类 平均 法 
R， = Rp + Rg (4-21) 
三 、 依 类 结果 的 选择 


不 同 的 系统 聚 类 方法 得 到 的 结果 有 差异 ,如 云南 省 某 地 区 超 基 性 岩 体 岩 样 的 聚 类 分 析 
结果 (图 4-3) 就 不 一 样 。 究 竟 哪 种 方法 的 分 类 结果 好 ,目前 尚 无 合适 的 衡量 标准 。 在 实际 
应 用 中 ,要 结合 其 他 地 质 理论 及 资料 ,分 析 不 同方 法 给 出 的 分 类 结果 ,从 中 确定 一 种 合理 的 
分 类 方案 。 

四 、 数 据 预 处 理 

由 于 变量 的 单位 和 观测 值 的 数量 级 可 能 不 同 ,者 直接 用 原始 观测 值 计 算 聚 类 统计 量 ,就 
会 突出 观测 值 绝对 值 大 的 变量 的 作用 ,压低 观测 值 绝 对 值 小 的 变量 的 影响 。 因 此 ,在 进行 聚 
失 分 析 时 应 采用 合适 的 数据 处 理 方法 (参见 第 二 章 ) 对 原始 数据 进行 标准 化 处 理 。 

五 、 僻 类 分 析 流 程 

总 络 上 述 聚 类 分 析 过 程 , 给 出 如 下 聚 类 分 析 流 程 图 (图 4-4)，。 
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图 4-3 超 基 性 岩 体 岩 样 聚 类 谱系 图 


9 3 分 解法 聚 类 分 析 

一 、 分 解法 聚 类 的 基本 思想 

如 果 把 数据 矩阵 式 (4-1) 视 为 一 个 数据 序列 ,那么 分 解法 聚 类 分 析 就 是 以 段 内 离 差 平方 
和 为 分 类 统计 量 , 找 出 数据 序列 的 变化 界线 ,把 数据 序列 分 段 的 统计 分 析 方 法 。 把 数据 序列 
分 段 后 , 若 满足 段 内 离 差 平方 和 最 小 , 则 是 最 优 的 分 类 方案 。 这 种 分 类 方案 又 叫做 最 优 分 
割 。 

最 优 & 分 割 的 基本 思想 是 按照 段 内 离 差 平方 和 最 小 的 原则 ,依次 找 出 数据 序列 的 一 1 
个 分 点 ,把 数据 序列 分 为 上 段 。 

二 、 分 解法 聚 类 的 基本 过 程 

为 了 书写 方便 ,在 此 把 数据 序列 简 记 为 : 

Km = (KI RX 

式 中 =xa yray ny Tn) (i=1,2,.",n)。 

1。 符号 说 明 

符号 S,(&;7 站 是 把 和 ,x 分 为 k 段 的 段 内 离 差 平 方 和 ,n 是 X 壬 ,x 中 的 样品 数 ,k 是 分 段 
数 ,j(1 志 j 志 nn 一 1) 表 示 以 第 j 个 样品 后 为 分 界 点 。 

2. 分 段 过 程 

(1) 分 2 段 。 









石油 数 学 地 质 


输入 n,m, nm 和 原始 数据 
输入 数据 预 处 理 参数 mm | 








nc=1 ,近邻 连接 法 
nc=2, 远 邻 连接 法 
nc=3, 类 平均 法 








nc=1, 最 短 距 府 法 
nc=2, 最 长 不离 法 
nc=3, 类 平均 法 

re=4, 重心 法 
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图 4-4 聚合 法 聚 类 分 析 流 程 图 

当 k= 二 2 时 , 令 7) 一 1,2,…:2 一 1, 按 式 (4-9) 计 算 23 tr S, (2 ;a ) 一 _ min S.(237), 那 
么 ,a 是 分 2 段 的 最 优 分 界 点 ,分 段 结果 如 下 : 
[CX, Xa ) (XE, + 3 )] 
(2) 分 3 段 。 

当 &==3 时 , 令 j 一 1,2,… yn 一 1,j 关 a ; 按 式 (4-9) 计 算 S, (3; 站 ,大 S38) = mn Sr(337), 
那么 ws 是 分 3 段 的 最 优 的 第 2 个 分 界 点 ,分 段 结果 如 下 : 

[CK Ka Ke CK Ks, CK 









包 轩 机 肾炎 分 本 


(3) 分 & 段 。 
当 用 一 疡 时 , 令 ) 王 1 2 一 1 天 oa 和 oa 按 式 (4-9) 计 算 S, (4;7), 若 S, (hs;ae_1) 
_min ,,S,《h3j) ,那么 a- 是 分 段 的 最 优 的 第 & 一 1 个 分 界 点 ,分 段 结果 如 下 
[CX Ka ¥, YK, KR RR ) 
三 、 分 段 数 的 确定 
对 于 分 段 数 ,根据 数据 序列 的 曲线 形态 ,可 以 给 出 
的 估计 值 &o。 另 外 ,也 可 以 预先 给 定 一 个 小 正 数 $, 当 段 内 
离 差 平方 和 S, (4;j) 过 6 时 结束 分 段 ,与 此 时 的 段 内 离 差 
平方 和 对 应 的 就 是 最 后 的 分 段 数 。 还 可 以 绘制 段 内 高 
差 平 方 和 随 分 段 数 的 变化 曲线 (图 4-5), 该 曲线 随 着 分 段 
数 的 增加 而 单调 递减 , 并 趋 于 平缓 ,可 以 选择 曲线 开始 平 图 45 段 内 高 闫 平方 和 与 
缓 时 的 点 对 应 的 & 为 最 优 的 分 段 数 。 分 段 数 的 关系 
四 、 最 优 分 割 计算 过 程 
总 绪 计 算 机 实现 最 优 分 割 的 过 程 , 给 出 最 优 分 割 流 程 
图 (图 4-6) 。 





4 应 用 实例 


【 例 1 油气 地 表 化 探 指标 的 分 类 。 

在 油气 地 表 化 探 工作 中 ,一般 要 分 析 样 品 的 甲烷 、 乙 烷 、 丙 烷 、 紫 外 .荧光 ,总 烃 和 重 烃 等 
20 余 项 指示 地 下 油气 的 指标 。 这 些 指标 既 有 相对 的 独立 性 ,又 存在 着 一 定 的 成 因 联系 。 因 
此 ,可 利用 聚 类 分 析 对 它们 分 类 ,从 而 研究 它们 的 成 因 联系 ,选择 有 代表 性 的 指标 ,化 简 油 气 
地 表 化 探 工作 。 

在 中 国 东部 某 地 区 油气 地 表 化 探 样品 29 项 指标 的 聚 类 谱系 图 (图 4-7) 上 , 取 相关 系数 
r 一 0. 75, 把 指标 分 成 13 类 。 其 中 成 因 联系 密切 的 有 酸 解 烃 、 紫 外 和 荧光 类 。 

酸 解 烃 类 包含 了 全 部 的 酸 解 烃 指标 。 其 中 甲烷 与 总 烃 以 >= 0. 98 聚 为 一 类 ,其 原因 在 
于 甲烷 占 了 总 烃 的 绝 大 部 分 ,并 有 密切 的 成 因 联系 。 甲 烷 在 油气 藏 中 的 浓度 最 高 , 运 移 能 力 
强 ,到 达 地 表 的 数量 最 多 。 重 烃 的 综合 性 强 , 易 被 土壤 吸附 ,直接 反映 烃 场 浓度 的 大 小 和 地 
下 油气 的 性 质 。 因 此 ,可 将 它们 作为 油气 地 表 化 探 的 重要 指标 。 

紫外 和 荧光 类 包括 了 紫外 (紫外 216 除外 ) 和 荧光 指标 。 它 们 都 是 检测 油气 藏 中 芳烃 混 
合 物 的 直接 指标 。 因 此 ,可 从 这 两 类 中 各 选 一 个 指标 作为 它们 的 代表 性 指标 ， 

其 他 分 散 指标 可 供 参考 。 

根据 上 述 分 析 ,舍弃 部 分 指标 后 , 既 可 保证 油气 地 表 化 探 工作 成 果 的 质量 ,又 可 减少 油 
气 地 表 化 探 的 工作 量 ， 

【 例 2 盆地 含油 气 远景 评价 。 

应 用 聚 类 分 析 可 对 不 同 勘 探 程度 的 含油 气 盆地 进行 远景 评价 ,其 实质 是 地 质 参 数 的 类 
比 。 因 此 ,评价 结果 的 可 靠 性 依赖 于 参与 评价 的 地 质 参数 。 选 取 一 定数 量 的 含油 气 盆地 (其 
探 程度 较 高 的 和 待 评价 的 盆地 ) 以 及 盆地 之 间 可 类 比 的 定量 和 定性 地 质 参 数 作 聚 类 分 析 ,可 
由 已 知 含油 气 远景 的 盆地 推测 待 评价 盆地 的 含油 气 远景 。 
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输入 样品 及 变量 数 、 原 始 数据 


输入 参加 分 类 的 起 止 样品 号 M,N 





计算 各 子 段 最 优 二 分 割 
段 内 离 差 平方 和 及 分 点 


图 4-6 最 优 分 割 流程 图 


本 例 选 取 了 48 个 含油 气 盆 地 ,类比 地 质 参 数 分 5 类 30 项 ,原始 数据 见 表 4-1。 对 于 其 
中 的 定性 地 质 参 数 , 如 盆地 类 型 .地质 时 代 等 ,要 进行 定量 化 处 理 ,处 理 方 法 是 ; 

盆地 类 型 :分 内 陆 .沿海 ,海湾 和 海洋 4 项 , 按 是 为 1, 不 是 为 0 编码 。 

@ 地 质 时 代 : 分 第 三 纪 , 日 平 纪 、 伯 罗 纪 ,三 谷 纪 二 悉 纪 , 石 怪 纪 、 泥 倪 纪 、 志 留 纪 、 奥 隐 


纪 和 和 寒 武 纪 共 10 项 , 按 有 为 1, 无 为 0 编码 。 


号 宕 性 ;分 砂岩 、 碳 酸 盐 宕 、 火 成 岩 和 基 宕 4 项 , 按 有 为 1 ,无 为 0 编码 。 
在 表 4-1 中 ,人 铭 地 类 型 ,沉积 时 代 和 储 层 时 代 、 储 层 岩 性 分 别 按 吕 , 忆 ,@ 中 的 顺序 排列 ， 


盆地 面积 的 单位 为 10" km ,厚度 的 单位 是 10”m。 
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图 4-7 油气 地 表 化 探 指标 聚 类 谱系 图 

对 原始 数据 进行 标准 差 标 准 化 后 ,分 别 采 用 相关 系数 近邻 连接 法 和 欧 氏 距离 最 短 距 离 
法 进行 系统 聚 类 ,得 聚 类 谱系 图 (图 4-8) 。 因 地 质 类 比 参数 的 局 限 性 , 故 本 例 仅 是 方法 上 的 
演习 。 尽 管 如 此 ,所 得 结论 也 能 说 明 一 些 问题 。 

【 例 3 大王 北 洼 陷 货 车 烷 油 源 对 比 。 

油 源 对 比 是 根据 地 质 和 地 球 化 学 特征 ,确定 石油 和 源 岩 之 间 成 因 联系 的 工作 。 它 包括 
石油 与 烃 源 岩 之 间 以 及 不 同 储 层 中 石油 之 间 的 对 比 两 个 方面 。 众 所 周知 , 烃 源 岩 中 的 干 栈 
根 在 一 定 条 件 下 裂解 形成 石油 和 天 然 气 , 其 中 一 部 分 运 移 到 储 集 层 中 ,一 部 分 残留 在 烃 源 岩 
内 。 因 此 , 烃 源 岩 中 的 干 酷 根 .沥青 与 来 自 该 层 系 的 油气 就 有 着 亲缘 关系 ,在 化 学 组 成 上 必 
然 有 着 某 种 程度 的 相似 性 。 同 源 油 气 化 学 组 成 的 相似 程度 高 , 异 源 油 气 化 学 组 成 的 相似 程 
度 低 。 这 种 相似 性 就 是 我 们 进行 油 源 对 比 的 基本 依据 。 : 

油 源 对 比 的 基础 是 受 地 质 资料 支持 的 化 学 相关 性 ,因此 对 比 参数 的 选择 非常 重要 。 目 
前 油 源 对 比 工作 中 ,对 研究 对 象 的 化 学 分 析 可 以 获得 大 量 的 化 学 组 成 数据 ,如 何 合理 地 解释 
这 些 分 析 资 料 ,得 出 正确 的 结论 ,仍然 是 油 源 对 比 工作 中 的 难点 。 聚 类 分 析 能 够 根据 样品 多 
个 参数 的 综合 特征 ,确定 样品 之 间 的 相似 程度 ,是 油 源 对 比 的 一 种 可 行 性 方法 。 

大 王 北 洼 陷 有 古 近 系 沙 四 上 亚 段 . 沙 三 段 和 沙 一 段 三 套 有 机 质 丰 度 高 、 类 型 好 的 泥 质 烃 
源 岩 。 目 前 已 在 该 注 陷 的 沙河 街 组 发 现 了 三 个 油田 。 通 过 色 - 质 谱 分 析 技 术 对 烃 源 岩 和 石 
油 的 生物 标志 化 合 物 组 成 进行 了 系统 分 析 。 





石油 数字 地 筷 


表 4-1 


含油 气 盆 地 类 比 地 质 参 数 





1 尼日利亚 沿海 | 1100000000 0. 1000000000 0100 
2 波 利 尼 亚 克 0000011111 0 0000011000 1000 
3 三 得 盆地 4. 0111111111 0， 0001000011 0100 
4 锡 尔 特 盆 地 4, 1100000000 0. 1100000000 0100 
5 苏伊士 -红海 4. 1111111000 0. 1111111000 0010 
6 北 海 5. 1111111000 0, 1111100000 0001 
7 荷兰 -德国 盆地 0. 1111110000 0, 0111100000 1000 
8 维也纳 盆地 0. 1000000000 0. 1000000000 1000 
9 前 略 尔 巴 陡 山 1 1111000000 0. 1100000000 1000 
10 供 尔 加 -乌拉 和 尔 6. 0001i111000 0. 0000111000 1000 
11 伯 朝 拉 倪 地 2. 0011111000 0. 0000111000 1000 
12 南里 海 2.6 1010000000 1. 1000000000 1000 
13 波斯 湾 32. 1101111111 1. 1110000000 0010 
14 布 哈 提 5. 1110000000 0， 0110000000 1000 
15 紫 达 木 盆 地 1. 1110000000 1. 1000000000 1000 
16 塔 里 术 侈 地 6. 1111111000 1. 1010000000 1000 
17 准噶尔 盆地 1. 1111110000 1. 1001100000 1000 
18 吐鲁番 盆地 0. 1110000000 0, 0010000000 1000 
19 陕 甘于 盆地 2. 0101111000 0. 0011000000 1000 
20 酒泉 盆地 . 0. 1110000000 0, 1000000000 1000 
21 四 川 盆 地 2. O101111111 1. 0011100000 1000 
22 江汉 盆地 0. 1000000000 0, 1000000000 1000 
23 渤海 湾 3. 1000000000 0. 1000000000 0010 
24 松 辽 盆地 12, 0110000000 1, 0100000000 1000 
25 西西 伯 利 亚 33. 1101000000 0. 0110000000 1000 
26 萨 哈 林 0. 50 1100000000 0， 1000000000 0001 
27 苏门答腊 2. 30 1000000000 0. 1000000000 0001 
28 北 爪 哇 盆 地 0. 40 1000000000 0. 1000000000 0001 
29 沙 捞 越 0. 35 1000000000 0， 1000000000 0001 
30 东 加 里 曼 丹 1. 50 1010000000 0. 1000000000 0001 
31 佩斯 分 地 1.04 | 1101111110 1. 0011100000 1000 
32 库 珀 盆地 1. 27 0001100000 0. 0000100000 1000 
33 吉普 斯 兰 0. 40 1100000000 0， 1100000000 0010 
34 库 克 湾 0. 39 1111000000 0. 1000000000 0010 
35 阿尔 伯 达 盆地 6.00 0111111tl1 0. 0101111000 1000 
36 汾 河 盆地 0. 60 1111111111 0. 0111100000 1000 
37 落 基 山 诸 盆地 6. 00 j111111111 1， 1111110000 1000 
38 丹佛 盆地 1. 30 1111111111 0, 0111100000 1000 
39 加 里 福 尼 亚 诸 盆地 1. 80 1100000000 1. 1100000000 0100 
40 阿 巴 拉 契 亚 4.70 0000011111 0. 0000011111 1000 
41 北美 地 台 11. 0000111311 1. 0000100010 1000 
42 西 德 克 萨 斯 (二 ) 20 0000111111 0. 0000111110 1000 
43 墨西哥 湾 11. 00 1110000000 1. 1110000000 0010 
44 维 拉 痪 鲁 斯 - 塔 巴 斯 克 60 1110000000 0. 1100000000 0010 
45 马 拉 开 波 -法 尔 康 85 1100000000 0. 1100000000 0100 
46 普 图 马 约 60 1111000000 0, 0100000000 1000 
47 圣 克 和 鲁 斯 80 1111111000 0, 0100011000 1000 
48 瓜 亚 及 尔 25 1100000000 0， 1000000000 0100 





原油 和 烃 源 行 省 戎 烷 生物 标志 物 的 组 成 受 母 源 输 入 .沉积 环境 和 成 熟 度 等 多 种 因素 影 
啊 ,利用 质谱 图 鉴定 的 全 部 化 合 物 峰 面积 的 相对 含量 包含 所 有 这 些 信息 ,直接 利用 聚 类 分 析 
进行 油 源 对 比 ,可 以 最 大 限度 地 利用 生物 标志 化 合 物 的 所 有 成 因 信息 ,减少 人 为 选择 一 个 或 
儿 个 参数 进行 对 比 的 片面 性 。 对 大 王 北 注 陷 采集 的 所 有 原油 样品 和 烃 源 岩 样 品 ,以 m/z 二 217 
和 m/z 二 191 鉴定 的 包括 孕 省 烷 . 升 孕 省 烷 、 重 排 省 烷 、 规 则 省 烷 、 三 环 戎 烷 、 五 环 三 茸 烷 在 
内 的 53 种 化 合 物 的 相对 含量 为 变量 ,进行 Q 型 聚 类 分 析 ,得 到 了 原始 数据 相关 系数 远 邻 连 
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1.00 0.80 0.60 0.40 1.000.800.60 0.40 ， ， 
尼日利亚 沿海 1 
0.99 瓜 亚 及 尔 412 48 
0.97 锡 尔 特 盆地 3.39 3 
0.86 开 波 -法 尔 康 218 ,9 
0 50 加 里 福 尼 亚 诸 盆地 2 89 46 
0 73 维也纳 盆地 pp, 12 
0.62 so 0 0 
0 80 前 路 尔 巴 计 山 230 20 
0 63 普 图 马 约 3 49 22 
oe ”南里 海 3.56 3 
0 98 柴 达 木 盆地 3 65 14 

九泉 盆地 20 
0.75 es 
l 、 30 
0 78 : 2.07 
3 哥 湾 3.99 29 
维 拉 克 重 斯 - 282 33 
库 克 湾 43 
0.52 2.69 
0.45 布 哈 所 3.49 34 
; 萨 哈 林 34 
0.85 4.31 
东 加 里 曼 丹 2.85 人 
沙 措 越 39 
0.54 4.59 
ee 北 爪哇 盆地 P| 
0 63 流利 尼 亚 殉 443 17 
0 61 阿尔 伯 达 盆地 4 39 16 
0.91 伏尔加 -乌拉 未 463 19 
0 60 伯 朝 拉 盆 地 467 24 
0.78 机 4.82 32 
西 德 克 萨 斯 (二 ) 2 9432 
北美 地 人 台 21 
0 58 4.11 
9 圣 克 鲁 盆地 439 31 
陕 甘 宁 盆 地 10 26 
0 69 四 川 盆地 5s06 38 
0 99 汾 河 盆 地 4 78 11 
: 丹佛 盆地 47 
0.55 . 5,25 
和 落 基 山 诸 盆 地 3 35 
> 库 珀 盆地 44 37 
0.48 5.44 
5 塔里木 盆地 5 
三 登 贫 地 574 5 
0.57 RE 5.79 “3 
0 50 荷兰 -德国 盆地 6 .38 2 
624 准 鸣 尔 盆地 s75 40 
0 41 苏伊士 -红海 5 82 牧 
0.48 6.94 3 
和 西西 伯 利 亚 
松 辽 盆地 ”一 .09 18 
0 23 A 8.09 
吐鲁番 盆地 3 
| (b) 欧 氏 距离 最 短 距离 法 束 关 谱系 加 
(a) 相关 系数 近邻 连接 法 聚 类 谱系 图 ( 译 号 1~48 为 盆地 编号 , 其 对 应 的 盆地 名 称 见 表 4-]) 


图 4-8 含油 气 盆 地 聚 类 谱系 图 

接 法 聚 类 谱系 图 (图 4-9)。 从 谱系 图 上 可 以 看 到 , 若 以 相关 系数 r= 二 0. 8 作为 分 类 标准 , 研 
究 区 的 原油 和 烃 源 岩 可 分 为 五 类 :DX361 和 D359-2 原油 与 沙 四 段 烃 源 岩 为 一 类 , 油 、 源 间 
的 相关 系数 在 0. 82~0. 90 之 间 ,表明 这 两 个 原油 样品 的 成 因 与 沙 四 段 烃 源 岩 联系 最 密切 ; 
DB25-23 ,DB10-4,D371,D65-51 和 D65 原油 样品 与 所 有 埋藏 在 3 000 一 3 700 m 深度 范围 内 
的 沙 三 段 烃 源 岩 为 一 类 , 油 . 源 间 的 相关 系数 都 在 0. 90 以 上 ,表明 它们 的 成 因 与 沙 三 段 烃 源 
岩 有 密切 联系 ;一 个 运 深 超过 4 100 m 的 沙 三 段 烃 源 岩 为 一 类 ,没有 与 之 密切 相关 的 原油 样 
品 ;D359-1 原油 样品 和 沙 一 段 烃 源 岩 为 一 类 , 油 、 源 间 的 相关 系数 为 0. 92, 表 明 该 油 样 与 沙 
一 段 烃 源 岩 密切 相关 ;其 余 的 DB14-18 ,D35-5-4,D35-11-x5 和 D355 原油 样品 为 一 类 ,样品 
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相关 系数 1.00 0.80 0.60 0.40 
0.96 1 DX361 
0 90 2 | 2 D359-2 
3 | 沙 四 烃 源 岩 Es, 烃 源 兰 
ee 4 Es 烃 源 岩 
5 全 烃 源 岩 
ot | PE 8 
0.76 上 9 
ee 6 | DB25-23 
7 | Es; 烃 源 岩 
0.97 | 
8 | DB10-4 
0.99 加 
的 9 沙 三 烃 源 岩 D371 
10 | DB65-51 
9 
” 12 BEs , 烃 源 岩 
0.90 
i 13 Es; 烃 源 岩 
0 66 14 一 一 一 一 二 ,| | Es; 烃 源 岩 
和 5 Es; 烃 源 岩 | 
Os 村 
| E 
0.62 | 5 径 源 条 
18 D35-5-4 
0.98 
19 D35-11-x5 
0.93 0 
9 D355 
21 DB14-18 





图 4-9 ”大 王 北 洼 陷 洗 蓄 烷 油 源 对 比 聚 类 谱系 图 

间 的 相关 系数 超过 0.9, 与 这 类 原油 样品 关系 最 密切 的 是 沙 一 段 烃 源 岩 。 

【 例 43 人 请 集 层 综 合 评 价 。 

在 储 集 层 定量 评价 中 ,常用 的 评价 指标 有 均值 .饱和 度 中 值 .毛细 管 压力 .渗透 率 、. 孔 承 
度 和 分 选 系 数 等 。 以 上 述 指标 为 变量 ,采用 欧 氏 距离 系数 为 分 类 统计 量 , 对 华北 某 地 震 旦 系 
筋 迷 山 组 46 个 岩 样 进行 Q 型 聚 类 分 析 ,得 到 储 集 层 定 量 分 类 谱系 图 (图 4-10)。 

由 图 4-10 可 以 看 出 , 着 以 距离 系数 0. 25 为 分 类 标准 ,特征 典型 的 储 集 层 有 三 类 , 即 以 
溶 蚀 孔 洞 颖 与 构造 缝 为 主 的 好 储 层 .以 唱 间 幼 为 主 的 差 储 集 层 .以 基质 微 孔 为 主 的 非 储 屋 ， 
而 1,14,8 号 岩 样 为 特殊 类 型 的 储 集 层 。 : 

【 例 5] 岩 性 段 划 分 。 z 

某 盆地 gl14 并 有 自然 伽 马 、 自 然 电位 等 测 井 资料 。 在 井 段 1 870 一 2 040 m, 对 自然 伽 
号 . 目 然 电位 曲线 以 0. 25 m 的 深度 间隔 取样 构成 数据 序列 ,对 该 数据 序列 最 优 分 割 , 绘 出 
宕 性 剖面 与 分 割 结果 对 比 图 (图 4-11)， 

从 图 4-11 上 可 以 看 出 ,基本 上 可 以 把 岩 性 段 分 开 , 相 邻 的 两 条 分 割 线 是 某 种 岩 性 段 的 
项 、. 底 界限 。 由 此 看 出 ,对 测 井 曲线 进行 分 解法 聚 类 分 析 ,可 以 为 测 井 地 质 解 释 提 供 参 考 依 
据 。 
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图 4-10 华北 某 地 震 号 系 雾 迷 山 组 储 层 图 4-11 尝 性 剖面 与 分 割 结果 对 比 图 


分 类 谱系 图 ( 据 伍 友 佳 ,2000 ,修改 ) 


思考 与 练 习 

. 什么 是 聚 类 分 析 ? 
.在 聚 类 分 析 中 为 何 要 对 原始 数据 进行 预 处 理 ? 
.常用 的 定量 数据 预 处 理 方法 有 几 种 ? 试 写 出 常用 的 定量 数据 预 处 理 方 法 变换 公式 ? 
最 常用 的 聚合 法 聚 类 统计 量 是 什么 ? 其 地 质 内 涵 是 什么 ? 
分 解法 聚 类 分 析 的 统计 量 是 什么 ”其 地 质 内 涵 是 什么 ? 
， 斌 述 聚 合法 与 分 解法 聚 类 分 析 的 基本 过 程 。. 
， 如 何 确 定 分 解法 的 最 优 分 段 数 ? 
.假设 ,ks ,ks 分 别 是 取 自 三 套 生 油 层 系 的 岩 样 ,ko。 是 取 自 储 集 层 的 油 样 。 据 表 4-2 
中 的 数据 ,试用 相关 系数 、 相 似 系数 、 距 离 系 数 进行 聚合 法 聚 类 分 析 , 并 分 析 聚 类 结果 的 差 
异 , 最 终 对 油 样 ko 的 油 源 做 出 合理 的 解释 。 

9. 现 有 某 并 段 自 然 人 徊 马 、 自 然 电 位 .电阻 率 测 井 的 六 组 实测 值 及 其 正规 化 数据 ( 表 
4-3)。 试 据 表 中 两 种 数据 对 数据 序列 进行 最 优 3 分 割 , 并 比较 分 类 结果 的 差异 。 


6 ~ GE Mb 
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表 4-2 华 烷 族 化 合 物 相 对 含量 表 


表 4-3 某 井 段 电 测 井 数据 


424 


自然 仰 马 /(X10-5 伦琴，h-1) 自然 电位 /mV 电阻 率 / (由 mn) 
测 值 深度 /m 
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第 五 章 ”判别 分 析 


地 质 学 领域 内 有 很 多 属于 归 类 研究 的 问题 ,如 销 穿 储 层 的 含油 气 性 ,岩石 样品 的 沉积 
相 , 生 油 宕 的 热 演化 阶段 等 。 这 类 问题 的 共性 是 确定 个 体 应 属于 已 知 类 中 的 哪 一 类 , 即 对 个 
体 进行 归 类 ,或 者 说 对 个 体 的 归属 做 出 判定 。 为 了 叙述 方便 ,我 们 不 讨论 具体 问题 ,并 统称 
个 体 和 已 知 的 类 为 样品 和 总 体 , 在 此 基础 上 给 出 判别 分 析 的 一 般 概念 。 

假设 A 二 {ai ,as，…,ac} 是 从 已 知 的 G 个 总 体 中 取出 的 G 组 样品 (代表 G 个 总 体 ), 每 
个 样品 有 mx 个 变量 。 判 别 分 析 是 根据 G 组 样品 m 个 变量 的 观测 值 ,建立 总 体 与 样品 X(X 
SE A) 之 间 的 定量 关系 , 即 判 别 函 数 的 一 种 多 元 统计 分 析 方 法 。 当 G==2 时 ,叫做 两 总 体 判 
别 ,又 称 为 线性 判别 ; 当 G>2 时 ,叫做 多 总 体 判 别 。 逐步 判别 分 析 是 在 m 个 变量 中 “筛选 ” 
人 


S 1 两 总 体 判别 分 析 


两 总 体 判 别 就 是 确定 样品 立 是 属于 总 体 A 还 是 属于 总 体 B 的 问题 。 判 定 样品 归属 的 
判别 函数 叫做 线性 判别 函数 。 

一 、 线 性 判别 函数 的 一 般 形式 

如 果 样 品 仅 有 zi ,zs 两 个 变量 ,总 体 A,B 的 样品 点 分 别 
落 在 两 个 椭圆 内 (图 5-1), 当 zi ,zz 分 别 落 在 区 间 (a,6b), (c,d) 
内 时 , 联 不 能 确定 样品 属于 总 体 A 还 是 属于 总 体 B。 如 果 把 
坐标 系 旋转 a 角 , 变 为 新 的 y,z 坐标 系 ,那么 变量 y 可 以 把 总 
体 A 与 B 分开, 即 可 以 用 y 判定 样品 的 归属 。 变 量 y 的 形式 
为 : 

y 一 Cixi 十 czza 
设 样品 有 mx 个 变量 ,那么 y 的 一 般 形式 为 ， 
一 ciZI 十 czzz 十 十 co (5-1) 图 5-1 判别 分 析 示意 图 

去 45-1) 称 为 线性 判别 函数 , 它 是 m 十 1 维 空间 的 一 个 平面 。 

二 、 确定 判别 函数 的 系数 

1， 原始 数据 

进行 线性 判别 分 析 的 任务 之 一 就 是 根据 样品 观测 值 确定 式 (5-1) 中 的 系数 cl ,cs，…， 

。 假设 从 总 体 A,B 中 分 别 取出 n,n 个 样品 ,每 个 样品 有 m 个 变量 ,它们 的 观测 值 分 别 
记 为 ， 





Za 一 1 213R 一 1 2 ,nn3) = 1,2, ,7m) (5-2) 
这 是 建立 线性 判别 函数 的 原始 数据 。 
2， 费 软 尔 准则 下 的 判别 函数 
把 式 (5-2) 中 的 观测 值 分 别 代 入 式 (5-1) ,得 判别 函数 值 ， 
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yi(a) = Dczsla) (= 1,2,°,n) 
j=] 


ye (Ob) a Dery (b) (k 一 1 2, ,7,) 
Fe 


记 
Q 一 [y(a) — yb) J (5-3) 
H= 》[y(a) — yOF + DO Ly 0) — yb) (5-4) 
i 二 1 二 1 


式 (5-3),(5-4) 中 
ya) = TD ya) = Darla) 
a i=1 j=1 


ye 1 yu) 2 人 

建立 判别 函数 时 要 求 Q 达到 最 大 , 互 达到 最 小 (图 
5-2) , 即 两 组 判别 函数 点 的 中 心 距 最 大 ,组 内 判别 函数 点 
的 离散 度 最 小 。 满 足以 上 条 件 的 判别 函数 可 最 大 限度 地 
把 4,B 区 分 开 。 上 述 准 则 由 费 歇 尔 提出 , 故 称 费 软 尔 准 
则 。 

上 述 准 则 等 价 于 要 求 

V = Q/H 

达到 最 大 。 闪 是 ci;G 王 1,2，… ,mm) 的 二 次 聘 数 ,是 Vy>0， 
根据 极 值 原理 有 z 





ge 0 
对 上 式 化 简 整 理 , 则 有 


一 图 5-2 品 点 lS 
Dsics 三 d, (5-5) 样品 点 在 ?平面 上 的 投影 
一 1 


式 中 
SA 一 > [zs (a) — zj(a) [zr (a) — xz.(a) + 
i=1 


Do [zi C6) 一 二 (0)][Lza(6) — rb)] Gk= 1,2,.,m) 
i=1 


d = [za) — Zz, (6b)] CG = 1,2,°% ,mm) 

式 (5-5) 是 以 c; 为 变量 的 方程 组 ,从 中 可 解 出 c; 得 判别 函数 式 (5-1)， 

三 、 显 著 性 检验 及 样品 的 判别 

若 总 体 A,B 差异 不 明显 ,那么 由 观测 值 建立 的 判别 函数 就 没有 实际 意义 。 为 此 ,需要 
对 A,B 的 差异 性 进行 检验 。 

1. 检验 方法 

用 已 建立 的 判别 函数 对 已 知 样品 的 总 体重 新 判定 , 若 判 断 对 了 n(n 二 (n, 十 nw)) 个 , 定 
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义 7 二 n/(n 十 n) 为 对 判 率 。r 越 大 ,A,B 差异 就 越 明显 ,判别 函数 的 判别 效果 就 越 显著 。 
2. 样品 总 体 的 判别 
在 判别 函数 显著 的 条 件 下 ,定义 
y. = [ney Ca) dt ny 6b) /nt n,) 
为 判别 样品 总 体 的 判别 指数 。 
若 y(e) 二 yy(Co ,把 样品 X 的 观测 值 z Gj 二 1,2,…,m) 代 入 判别 函数 式 (5-1) ,得 淹 
别 函数 值 y, 当 y 盖 时 ,XEAh, 否 则 XEB。 


S82 多 总 体 判 别 分 析 
一 、 原 始 数据 


如 果 从 G 个 总 体 中 分 别 取 出 ns(g 一 1,2,…,G) 个 样品 ,每 个 样品 有 m 个 变量 ,那么 样 
品 观 测 值 构成 的 观测 样本 为 ; 


(1) 





义 艳 
区 
种 时 = ， (g =1,2," ,Gk = 1,2, ,ns) 
9 
式 中 x 总 体 as Cg 二 1,2,…,G) 中 第 Ck 二 1,2,… ,ns) 个 样品 的 第 i 个 变量 的 观测 


值 。 
XX 一 一 求 判别 函数 的 原始 数据 。 
二 、 贝 叶 斯 (Bayes) 准 则 下 建立 多 总 体 判 别 函 数 的 基本 原理 
对 于 取 自 G 个 已 知 总 体 的 样品 X ,在 对 它 所 属 的 总 体 作 出 判定 以 前 , 它 可 能 属于 任何 
一 个 总 体 , 但 是 它 归 属于 总 体 a,(g 二 1,2,…,G) 的 概率 不 同 。 由 Bayes 公式 可 以 求 得 X 属 
于 总 体 a,《(g 二 1,2,…,G) 的 条 件 概率 为 : 


G 
plas/X) = plas p(X/as)/ Dpla) p(X/a) 
j=1 


= pafa CX) Sp,f,(X) (5-6) 
式 中 po,fs(X) 一 一 总 体 aslg= 二 1,2,…,G) 的 先 验 概率 和 概率 密度 。 
如 果 如 as/X) 是 条 件 概率 中 的 最 大 者 , 即 
plai/X) = max p (as/ X) 
那么 ,判定 样品 祥 Eas 时 判 错 的 概率 最 小 。 在 计算 条 件 概 率 (av/X) 时 , 式 (5-6) 的 分 母 是 
一 个 常数 ,条 件 概率 的 相对 大 小 不 会 受 其 影响 。 因 此 , 记 
Es.(X) = psfs(X) (g = 1, 2，…G) (5-7) 
式 (5-7) 是 Bayes 准则 下 多 总 体 判 别 的 一 般 判 别 函数 ,根据 函数 值 的 相对 大 小 可 对 样品 
X 的 总 体 做 出 判别 。 
三 、 正 态 总 体 的 判别 函数 
用 式 (5-7) 判 定 样 品 X 的 总 体 , 需 要 进一步 确定 总 体 的 先 验 概 率 p, 和 概率 密度 
f,(X), \ 
假设 总 体 服从 正 态 分 布 ,其 概率 密度 为 : 








石油 数字 地 攻 


f.(X) = 12 exp[— 二 (X— Le) DE 1 ( 束 一 有 )J (5-8) 


= Cx, xr ye ) 














式 中 Hs dg 的 期 望 品 量 ， 
丈 一 一 各 个 总 体 共 同 的 协 方差 短 阵 ; 
由 原始 数据 可 求 得 1 的 估计 值 X 和 5S， 并 且 
2 SI1 $12 Sl1m 
四 二 S21 $22 "Som 
年。 一 (g 一 1 2， 0) ; S 一 | 
人 Sml Sm2 > S$ prom 
式 中 
zo oid = 1,2,,m) 
Ts =1 
G "gy =- 一。 4 人 
$33 一 二 GA A YY 二 1 2 …)713 AN 一 7 十 7 十 十 ?cy) 
由 此 ,可 把 式 (5-8) 改 写 为 ， 
记 O0 一 总 - Sexp[— EX—K)'S tCX— RT,)] (5-9) 


把 式 (5-9) 和 ps 二 ny/N 代入 式 (5-7) ,再 对 该 式 两 边 取 自然 对 数 并 舍 去 其 中 与 g 无 天 
的 项 ,化 简 得 正 态 总 体 下 的 判别 函数 ，; 
F(X) = In ge + XS XK, — XS 
(5-10) 
一 ln gs 十 en 十 cow (g = 1,2,.,G) 


式 中 
= Dm (有 


一 一 和 二 一 一 站 中 
Og 2 (kk | » 71) 


对 于 服从 其 他 分 布 的 总 体 来 说 ,仿照 上 述 做 法 可 以 得 到 相应 的 判别 函数 。 
四 、 对 样品 总 体 的 判别 
把 样品 X 的 观测 值 居 三 (zz2 zw ) 代 人 式 (5-10) ,得 下 (X)CE 一 1 2 7C)， 
知 
下 (起 ) 一 maxk s(X¥) 
那么 判定 样品 X 属于 总 体 as 的 条 件 概 率 为 : 
p: = exp[L F(X)]/ > ,expLF; (X)] (k= 1,2,.,G) 


天 三 半 
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五 、 判 别 函 数 的 显著 性 检验 

1， 对 判 率 检验 

利用 式 (5-10) 对 观测 样本 中 NCN= 坟 十 十 … 十 ne) 个 样品 的 总 体重 新 判定 , 若 判 断 
对 了 as<N) 个 ,那么 称 rr 二 n/N) 为 对 判 率 。r 越 大 ,总 体 间 的 差异 就 越 明显 ,判别 图 数 
的 判别 效果 就 越 好 。 

2. 马 哈 拉 诺 比 斯 距离 刀 检验 

假设 Ho :总体 差 异 不 明显 。 

统计 量 为 : 


me 和 
D’ = > Dns Cz — xX) (x CO— zr ) 
i=] 
式 中 


1 亡 1 < z 
x == 0 2 = 方 之 电 并 名 (z = 1 ,2,* ,7) 


DP 服从 目 由 度 为 m(G 一 1) 的 x? 分 布 。 给 定 检验 水 平 a, 查 xi 分 布 表 得 D? 的 临界 值 
D' 。 当 D >" 时 ,否定 假设 H。,, 即 拟定 的 mr 个 变量 能 够 区 分 开 已 知 的 G 个 总 体 ,否则 接 
受 假设 互 。, 即 拟定 的 天 个 变量 不 能 对 样品 的 归属 做 出 正确 的 判别 ,此 时 应 剔除 其 中 区 分 能 
力 小 的 变量 或 者 引入 一 些 更 有 效 的 变量 ,重新 建立 判别 函数 。 


3$3 逐步 判别 分 析 

在 拟定 的 判别 变量 zx ,z2，…，ze" 之 间 既 有 相对 的 独立 性 ,又 存在 着 一 定 的 成 因 联 
系 。 对 于 区 分 已 知 总 体 来 说 ,具有 成 因 联 系 的 那些 变量 表面 上 看 其 各 自 的 区 分 能 力 都 不 可 
忽视 ,但 当 把 zx 中选 入 判别 函数 后 ,又 使 得 先 选 和 的 ze 的 区 分 能 力 变 得 不 显著 了 。 另 外 , 建 
立 判 别 函数 时 需要 求 $-: , 若 存在 区 分 能 力 不 显 著 的 变量 ,将 导致 5-! 不 存在 , 故 求 不 出 判别 
函数 。 鉴 于 上 述 原 因 ,提出 “筛选 ?判别 能 力 强 的 变量 ,建立 经 济 实 用 的 判别 函数 的 逐步 判别 
分 析 。 它 的 基本 思想 与 逐步 回归 分 析 类 似 , 即 逐个 检验 变量 的 区 分 能 力 , 把 区 分 能 力 强 的 变 
量 “ 引 入 ” 浏 别 函 数 , 在 引入 变量 的 过 程 中 ,随时 “ 噜 除 ” 已 引 人 和 人 判别 函 数 中 的 区 分 能 力 变 弱 的 
变量 ,直到 既 没 有 区 分 能 力 强 的 变量 引入 ， 又 没有 区 分 能 力 变 弱 的 变量 吻 除 为 止 ， 

一 、 逐 步 判 别 分 析 方 法 原理 

1. 原始 数据 

逐步 判别 分 析 的 原始 数据 见 本 章 8 2 中 的 原始 数据 。 

2. Wilks A 统计 量 

它 是 检验 变量 区 分 能 力 的 指标 。 假 设 样本 数据 来 自 G 个 具有 相同 协 方 差 矩阵 的 正 态 
总 体 N (ps ,2) 。 为 了 检验 变量 的 区 分 能 力 , 定 义 样本 内 离 差 矩阵 多 ,样本 间 离 差 矩 阵 号 .总 
离 差 矩阵 了 ， 


样本 as 中 第 i 个 变量 的 平均 值 工 名 — Ly (g = 1,2,.,G) 


Ng 1 


全 部 样品 第 i 个 变量 的 平均 值 2 一 D2 Dz /ns 一 Dnoz 
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G ny 
wj 一 》， (zak 二 
g=1 & 一 1 
G 
b; = 人 》 na (x 一 元 人 ) Cx — x) 
=1 
G Ng 
,网 一 — rx) (zr dy 


=1 


W = (zui ) » B= (Di ) nxm » T= (£5 ) xm 


mes 
| 
和 


可 以 证 明 : 
T= Wi+iB 
Wilks A 统计 量 
U=|wW|I/|IT| 
是 在 假设 


Ho:p = pz 一 … 一 Ac 

下 检验 全 部 变量 综合 区 分 能 力 的 统计 指标 。U 越 小 ,样本 内 部 差异 越 小 ,样本 之 间 差 异 越 
大 , 即 Ho 不 成 立 。 

3 引入 与 日 除 "变量 的 统计 量 

统计 量 U 是 两 个 行列 式 的 比 , 如 果 按 行列 式 列 号 ri ,ri ，…rw 的 顺序 对 行列 式 进行 消 
去 计算 ,并 表示 出 消去 次 序 ,那么 U 可 以 改写 为 : 

Ue = [wr We 站 Sp be 2 大 (5-11) 

在 式 (5-11) 的 基础 上 ,可 以 导出 检验 变量 z” 判 别 能 力 的 Wilks 人 统计 车。 

(1)“ 引 人 ”变量 zx" 的 Wilks A 统计 量 及 对 zx" 的 检验 。 

假设 判别 分 析 进 行 也 步 , 共 引 信也 个 变量 zz ，… ,x0 都 是 判别 能 力 强 的 
变量 ) ,根据 式 (5-11), 有 : 


Uma = Lo de mo ee de mb] (5-12) 
和 车 判别 分 析 的 第 p 十 1 步 是 在 判别 函数 中 再 引入 变量 zx", 则 有 : 
Us rrr = Low wr wr wt Le Bi ot EE J (5-13) 
由 式 (5-12) ,5-13) 可 知 ,et /tp 是 引入 变量 ”后 U 的 改变 因子 ,将 其 记 为 ; 
U, = wr /ty (六 全 Crisrs se ,7,)) (5-14) 


LU. 越 小 ,表明 变量 x” 在 样本 之 间 的 差异 越 明 显 , 即 它 的 判别 能 力 就 越 强 。 因 此 ,U, 是 
检验 变量 x'” 判 别 能 力 的 Wilks A 统计 量 。 
假设 变量 x” 的 判别 能 力 小 , 则 统计 量 
Fl =[(—U)/G— /U/CN—G—p)1 
=[(N—G— pp — wh) /gm 1)w] 
服从 第 一 自由 度 为 (G 一 1) 、 第 二 自由 度 为 (N 一 G 一 p) 的 下 分 布 。 对 于 给 定 检验 水 平 a , 查 
分 布 表 F,(G 一 1, N 一 g 一 记 ) 得 临界 值 F, ,车 已 > 已 , 则 变量 z2 的 判别 能 力 强 , 应 把 变量 
Zz” 引入 判别 函数 。 
(2)“ 噜 除 ? 变 量 x 中 ”的 Wilks A 统计 量 及 对 zc 的 检验 。 
假设 判别 分 析 进 行 了 p 步 , 共 引入 了 pp 个 变量 x 人 ,x 人 I 
二 We 2 十 1 步 是 拟 上 剔除 判别 函数 中 的 变量 xz” (rE (rr 和 rs)) ,那么 工 
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的 判别 能 力 可 视 为 第 p 步 引入 xz" 的 判别 能 力 , 邑 : 
LU = wr /te (r € riores sr,)) (5-15) 
假设 变量 z” 的 判别 能 力 小 , 则 统计 量 
Fs =[(—U0)/(G— 1)]/UV;/(N—G— p+1)] 
= [(N—G—p+D(—U)]/[LG— DU 
服从 第 一 自由 度 为 (G 一 1) .第 二 自由 度 为 (N 一 G 一 p 十 1) 的 下 分 布 。 给 定 检 验 水 平 a , 查 
F,(G 一 1,N 一 G 一 pp 十 1) 分 布 表 ,得 临界 值 上- :五 上: 三 了 ; 则 变量 二 的 判别 能 力 小 ,应 从 
判别 函数 中 删除 变量 x"”。 
4. 逐步 判别 分 析 的 变换 公式 
逐步 判别 分 析 求 解 判 别 函 数 的 过 程 与 逐步 回归 分 析 求 解 回 妇 方 程 的 过 程 类 似 , 不 同 之 
处 是 逐步 回归 分 析 只 是 对 相关 系数 增 广 矩阵 R 进行 变换 ,而 逐步 判别 分 析 要 对 W 和 T 两 个 
矩阵 进行 变换 。 逐 步 判 别 分 析 的 第 p 十 1 步 不 论 是 引入 还 是 剔除 变量 xz” ,都 是 按 式 
(5-16),(5-17) 对 W,T 和 矩阵 进行 一 次 变换 。 第 p 十 1 步 变换 消去 多 ,了 和 矩阵 中 第 > 列 的 变换 
公式 如 下 ， 


T /To (k=r,l=r7) 
i te ee (5-16) 
— wi /wh) {krill=r) 
wp’ — wh * wh /vw (& 尖 rr 天 7 
1 /大 (k=r,i=7) 
tt (一 7 天 7 
ei ey (5-17) 
= (kr=7) 
tf — te «tp /tp (下 天 rr 天 7 
二 、 判 别 函 数 和 对 样品 的 判别 
1. 判别 品 数 
车 逐步 判别 分 析 进 行 了 p 步 结束 ,引入 变量 数 为 v(v<m) ,那么 判别 函数 为 ， 
F(X) = In ge 十 DPr® 十 cu (5-18) 
iEv 
式 中 
cP = (N—G) wp ry (i€ vg = 1,2,.,G) 
jEv ; 
| = Ne 


2. 对 样品 的 判别 
把 三 一 (x 人 和 s Te™) ) 代入 式 (5-18) ,得 判别 函数 值 F(X)(g=1,2,.,G) ; 若 
了 (有 天) = maxF.(X) 


那么 样品 XEas。xXEas 的 条 件 概率 为 : 
力 = exp[L F(X)]/2) exp[L 严 ( 尼 ) ] 


三 、 逐步 判别 分 析 计 算 过 程 
总 结 逐 步 判 别 分 析 的 计算 过 程 ,给 出 逐步 判别 分 析 流 程 图 (图 5-3) 。 





五 囊 数 字 翰 质 





输入 x，m，G 和 样品 观测 值 


输入 临界 值 六 和 大 
输入 先 验 类 型 PP 值 


计算 类 内 均值 、 总 均值 、 类 内 离 差 矩阵 
歼 和 总 离 差 矩阵 7， 引入 变量 数 Z=0 


剔除 变量 ? 
变换 挎 阵 刺 ，7, 引入 变量 数 L=L-1 


变换 矩阵 EF, T, 计算 判别 系数 和 判别 
年 阵 ,输出 中 间 结 果 , 引入 变量 数 L=L+1l 















N 
结束 


图 5-3 判别 分 析 流 程 图 


Y4 应 用 实例 

【 例 1 知性 剖面 的 反 演 。 

测 井 参数 是 岩石 的 效应 ,其 观测 值 的 差异 主要 取决 于 岩 性 , 即 依赖 于 岩石 的 矿物 成 分 ， 
颗粒 的 大 小 、 结 梅 以 及 兰 石 孔 院 中 流体 的 性 质 。 也 就 是 说 ,根据 钻 孔 的 测 井 参数 ,可 以 反 演 
销 孔 的 内 性 剖面 。 

某 砂砾 生 油 田 ,知心 实物 少 ,但 测 井 资料 比较 丰富 ,多 数 井 均 有 如 下 测 井 资料 : 

2 一 一 微 电 极 电阻 率 ,0 ，m; 

Wa 9 m 梯度 电阻 率 ,Q ”TD; 

zs 一 4m 梯 度 电阻 率 ,Q mi 

Xs 一 一 感应 电导 率 ,mS/m; 
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ZT 一 一 声波 时 差 ,js/m; 

zs 一 一 浅 侧 向 ,9 ” I} 

z1 一 一 补偿 中 子 孔 隙 度 ,%; 

xs 一 一 井 径 ,cm; 

zy 一 一 微 电 极 差 , 人 0，m。 

为 了 开展 砂砾 岩 油 藏 描述 工作 ， 利用 上 述 测 并 资料 建立 了 岩 性 识别 函数 ， 反 演 了 30 余 
口 无 岩心 井 的 岩 性 剖面 ,为 沉积 相 和 储 层 研究 提供 了 资料 。 具 体 做 法 如 下 : 

(1) 分 析 砂 砾 岩 油田 的 岩心 ,确定 岩石 类 型 数目 ,在 有 岩心 的 钻 孔 剖面 上 采集 不 同 岩 性 
对 应 的 各 种 测 井 参 数值 ,作为 判别 分 析 的 样本 。 

” (2) 根据 不 同 岩 石 类 型 的 样本 值 ,建立 识别 岩 性 的 判别 函数 。 

(3) 把 具有 岩心 井 段 的 测 井 参数 曲线 离散 抽样 输入 计算 机 ,利用 已 建立 的 判别 函数 对 
有 岩心 井 段 的 岩 性 进行 识别 ,以 检验 判别 函数 的 有 效 性 。 

(4) 在 判别 函数 有 效 的 条 件 下 ,把 无 岩心 井 的 相应 测 井 参数 曲线 离散 抽样 输入 计算 机 。 

(5) 把 不 同 深度 点 上 各 测 井 参 数 的 离散 抽样 值 代入 判别 函数 ,计算 判别 函数 值 ,以 其 中 
最 大 者 对 采样 点 的 岩 性 进行 归 类 ,并 记录 下 归 类 号 .相应 的 深度 和 测 井 参数 。 

(6) 根据 上 一 步 记 录 的 资料 ,由 计算 机 绘制 岩 性 剖面 .相应 的 测 间 参数 曲线 以 及 所 需 的 
等 值 线 图 等 。 a 

某 砂砾 岩 油 田 的 岩心 可 分 为 砾 岩 、 砂 岩 和 泥岩 三 种 类 型 。 在 岩 性 剖面 上 取 了 可 靠 的 84 
个 样 晶 (其 中 砾 岩 样品 30 个 ,砂岩 样品 30 个 ,泥岩 样品 24 个 ) 及 其 对 应 的 9 项 测 并 参数 , 进 
行 逐 步 判 别 分 析 , 引 人 7 项 参数 ,得 到 识别 砾 岩 、 砂 贿 和 泥岩 的 判别 函数 如 下 : 


FFCX) = 1.785 6z 十 0.646 5 下 而 5 二 ng 603 6z 和 
. ( 砾 岩 判别 函数 ) 


十 1.756 lz 十 14.506 0zxs 一 0.202 7zs — 205. 3920 
~ F(X) = 1,126 9z; + 0,479 4x; 十 0.150 6z 十 16.749 6xe 
. 、 ” (砂岩 判别 函数 ) 
十 1.873 27z 十 14.869 5xs 一 2.429 9zxs CO— 197,860 5 
F(X) 一 一 0.054 57i 十 0.313 5x; 十 0.203 27r 十 18.949 7 六 
(泥岩 判别 函数 ) 


十 2.615 7z; 十 17.857 8zxs 一 4.542 7xs 一 287.9940 

上 述 判别 函数 对 84 个 岩石 样品 中 砾 岩 砂岩、 泥岩 的 对 判 率 分 别 为 93% ,97 中 和 96 站， 

平均 对 判 率 为 95% 。 对 判 率 从 一 个 方面 反映 了 判别 函数 识别 岩 性 的 可 靠 程 度 。 但 是 ,这 些 

兰 石 样品 取 自 不 同 井 的 岩心 ,它们 并 不 代表 一 段 连续 的 地 层 谢 面 。 因 此 ,对 判 率 还 不 能 充分 

说 明 判 别 咕 数 对 连续 地 层 谢 面 的 识别 效果 。 为 此 ,又 用 上 述 判别 函数 识别 了 研究 区 内 永 1-5 

井 2 226 一 2 276 m 岩心 段 的 岩 性 ,以 此 来 检验 判别 函数 对 连续 地 层 前 面 进行 岩 性 识别 的 有 
效 性 。 

”从 岩心 剖面 与 识别 的 地 层 岩 性 剖面 (预测 前 面 , 图 5-4) 上 看 出 ,两 个 剖面 在 局 部 上 存在 
着 岩 性 的 差异 ,造成 这 一 差异 的 主要 原因 是 利用 砾 岩 .砂岩 和 泥岩 的 代表 性 样品 所 确定 的 判 
别 函 数 对 过 渡 性 岩层 进行 识别 时 ,就 会 出 现 岩 性 上 的 偏差 。 另外, 上、 下 岩层 对 憩 夹层 测 井 
参数 的 影响 以 及 测 井 参数 采样 间隔 偏 大 也 是 造成 岩 性 误 识 的 因素 。 从 整体 上 看 ,两 个 剖面 
吻合 较 好 ,预测 剖面 基本 上 反映 了 地 层 的 岩 性 特征 。 在 上 述 分 析 的 基础 上 ,利用 建立 的 判别 
果 数 预测 了 研究 区 内 无 岩心 井 的 岩 性 剖面 。 

【 例 23 预 测 生 油 岩 热 演化 阶段 。 
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深度 岩心 预测 微 电 极 4m 梯 度 ”感应 电导 率 ” 浅 侧 向 ”补偿 中 子 井 径 微 电 极 差 
/m 剖面 章 面 电阻 率 电阻 率 /7/(mSm ) /人 om) 孔隙 度 /cm / (fm) 
/ (9 -mm) /(Q.m) /% 


0.3 5.7 5.8 53.06.8 54.0 18.0 235.0 1.8 39.5 0.2 5.0 13.5 32.0 
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图 5-4 岩 性 剖面 及 部 分 电 测 曲线 图 

根据 生 油 岩 的 成 熟 度 ,一般 将 生 油 岩 的 热 演 化 过 程 分 为 未 成 熟 成熟, 高 成 熟 ,过 成 熟 四 
个 阶段 。 确 定 生 油 岩 的 热 演 化 阶段 是 油气 资源 评价 中 的 重要 研究 内 容 之 一 ,为 了 定量 确定 
生 油 岩 的 热 演化 阶段 ,统计 了 我 国有 关 探 区 66 个 生 油 层 系 的 生 油 门限 时 间 t、 生 油层 温度 芽 
以 及 生 油 层 的 埋藏 深度 五 的 数据 ( 表 5-1)。 

根据 统计 资料 , 取 十 273,t, 晶 ,1/H,in(T 十 273),1/(T 十 273) 为 变量 , 取 引 入 和 人 蓟 除 
变量 的 临界 值 及 二 fs 二 0, 引 人 4 个 变量 ,得 生 油 岩 热 演化 阶段 判别 陋 数 ， 

F(X)=—431, 677 2xi 十 4. 399 0z 一 0. 261 0zx; 十 200 298. 2zx 一 510 438.9 〈 未 成 熟 ) 

F,(X)=—432. 683 6z 十 4. 404 3z 一 0. 261 0zx; 十 200 782. 5zs 一 512 924.1 《成熟 ) 

F, (P=—433.834 0z 十 4. 410 8z 一 0. 260 8z; 十 201 345. 2xs 一 515 827.7 (高 成 熟 ) 

F,(X)=—434. 446 5zi 十 4. 414 0z 一 0. 259 8z; 十 201 681. 6x 一 517 606.3 〈 过 成 熟 ) 
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表 5-1 生 油 岩 热 演化 参数 


热 演 化 参数 
演化 阶段 样品 序号 二 区 




































































1 松 辽 盆地 ( 青 2 十 3) 125. 005 1 000 

2 松 辽 盆地 ( 青 1) 1 000 

3 松 辽 盆地 ( 青 2) 1 750 

4 岐 口 凹 陷 1 680 

5 泌 阳 凹陷 1 460 
二 6 湖北 (二 径 系 》 3 200 
阶 7 潜 江 四 陷 1 600 
段 8 高 邮 症 陷 1 980 
惠 民 四 隐 1 350 

站 化 目 隐 1 600 

东明 冲 陷 2 250 

松 辽 盆地 ( 姚 2) 1 480 

松 辽 盆地 ( 青 2 十 3) 1 550 

松 辽 盆地 ( 青 2 十 1) 2 190 

松 辽 盆地 ( 青 ) 1 799 

松 辽 盆地 ( 青 2) 1 851 

松 辽 盆地 ( 姚 2) 1 970 

岐 口 问 陷 2 001 

成 谱 阳 凹陷 1 700 
部 论 阳 凹陷 2 099 
阶 辽河 四 陷 2 001 
自 东台 四 陷 ( 息 宁 组 ) 3 201 
湖北 (二 和 春 系 ) 3 450 

高 邮 四 陷 ( 集 宁 组 ) 2 200 

高 邮 四 陷 ( 集 宁 组 ) 2 700 

沾 比 凹陷 2 300 

沾 化 凹陷 2 200 

泪 化 凹陷 2 500 

东明 凹陷 3 500 

松 辽 盆地 ( 青 2 十 3) 3 100 

松 辽 盆地 ( 青 1) 2 350 

松 辽 盆地 ( 青 1) 2 499 

松 辽 丛 地 ( 姚 2) 2 299 

松 辽 盆地 ( 姚 2) 2 150 

松 辽 盆地 ( 录 2) 2 401 

歧 口 止 陷 3 701 

湖北 (二 秋 系 》 4 050 

族 阳 凸 陷 2 300 

滋 阳 四 陷 2 799 

高 东台 冲 陷 ( 旦 宁 组 ) 3 201 
成 东台 凹陷 ( 兰 宁 组 ) 2 900 
熟 东台 加 陷 ( 捍 宁 组 ) 3 701 
阶 湖北 (二 香 系 ) 4 001 
段 高 邮 四 陷 ( 集 宁 组 ) 3 000 
高 邮 四 陷 ( 集 宁 组 ) 3 400 

惠 民 四 陷 2 800 

患 民 凹 陷 3 100 

高 邮 四 陷 ( 集 宁 组 ) 4 100 

沾 化 中 陷 2 700 

沾 化 凹陷 3 000 

沾 化 四 陷 3 100 

东明 四 陷 3 550 

东明 凹陷 3 550 






松 辽 盆地 ( 青 2 十 3) 
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样品 序号 地 区 ss 


松 辽 盆地 ( 姚 2》 ”123,205 3 555 
江汉 盆地 (洪江 组 ) 37. 005 4 300 
东台 四 陷 ( 阜 宁 组 ) 60. 005 4 100 
东台 钊 陷 ( 阜 宁 组 ) 57. 005 5 100 

湖北 (二 秋 系 ) 285 5 ?01 
湖北 (二 秋 系 ) 285.5 7 199 
高 邮 四 陷 ( 集 宁 组 ) 26 4 001 
20 3 700 
18 3 800 
36. 05 4 140 
271, 29 5 200 
湖北 (二 醒 系 ) 271. 29 4 900 
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变量 在 判别 函数 中 的 引信 顺序 以 及 各 演化 阶段 的 对 判 率 见 表 5-2。 

由 变量 的 引入 顺序 看 出 ,温度 是 有 机 质 热 演 化 过 程 的 决定 因素 ,温度 不 足 可 以 在 临界 温 
度 下 通过 演化 时 间 来 补偿 。 各 演化 阶段 的 对 判 率 都 超过 了 80% , 故 可 用 上 述 判别 函数 判别 
生 油 岩 的 热 演化 阶段 。 


表 5-2 变量 引入 顺序 及 演化 阶段 正 判 率 









jn( 了 十 273) 90. 107 8 
Tal3 29.072 5 ; 94 
t 0.433 9 : 96 
H 0, 297 9 


珠江 口 盆 地 第 三 系 生 油 岩 为 中 新 世 至 晚 渐 新 世 , 地 层 的 绝对 年 龄 约 16 一 30 Ma, 埋 藏 深 
度 为 2 200 m, 地 层 温度 为 104 C。 若 地 层 绝对 年 龄 以 25 Ma 计 , 按 上 述 判 别 函 数 计 算 , 则 
有 : Fi(X) = 514 572. 6,F,(X) = 514 581.6,Fs(X) = 514 582.5,F,(X) = 514 570.8, 其 
中 最 大 值 为 Fi(X) 。 因 此 ,可 以 认为 珠江 口 盆地 第 三 系 生 油 岩 处 在 高 成 熟 阶段 。 

【 例 3 识别 沉积 相 。 

不 同 沉积 环境 下 形成 的 沉积 物 , 其 成 分 成 熟 度 和 粒度 参数 不 同 ,因此 ,可 以 根据 沉积 岩 
样品 的 成 分 成 熟 度 或 者 粒度 参数 , 反 推 样品 的 沉积 相 。 如 东兴 凹陷 西部 沙 三 段 有 三 角 洲 、 浊 
流 和 风 梭 流 三 种 沉积 相 。 表 5-3 统计 了 上 述 沉积 要 中 45 块 岩 样 的 成 分 成 熟 度 参数 zi ( 石 
英 /( 长 石 十 岩 届 ))、 杂 其 含量 zx 和 胶结 物 含量 zs ,同时 还 分 析 了 样品 的 粒度 参数 M. ,a, Sh 
和 &e 。 根 据 表 5-3 中 的 数据 ,分 别 建立 了 三 角 洲 . 浊 流 和 风暴 流 相 识别 函数 。 

成 分 成 熟 度 参数 判别 函数 为 : 

F(X) = 2.284 lzi 十 35. 360 9zy 十 40.639 0zi 一 10.305 0 《三角洲 相 ) 
F,(X) 一 1.132 5z 十 45.340 7zs 十 25.947 9zi 一 7.493 4 〈 独 流 相 ) 
F,(X) = 1. 606 0zl 十 33.276 2z; + 36, 221 3x;3 一 7.9645 ( 风 共 流 相 ) 

粒度 参数 判别 函数 为 . 
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表 5-3 沉积 岩 样 品 参数 及 判别 检验 结果 
涡 | 样 | 成 分 参数 。” | 后 验 | 判 | 原 | 基 | 后 验 粒度 参数 
相 
1 


. 33 . 


C2 
-01 





















1 
,20 


1 1 0 0 1 | 0， 3 0. 0. 1. 40 
2 2. 67 0. 07 0.11 1 2 | 0， 2. { i. 0. 2.04 
3 1. 33 0. 30 0. 2 3 | 0. 4. 1， 0， 1. 46 
4 | 4.00 0.07 0., 1 2 | 0， 3. 2: 0., 1. 63 
5 1, 50 0, 05 0, 1 1 | 0. 3, 0， 0. 1. 55 
6 | 2.12 0.06 0. 1 1 | 0. 3， 0. 0， 1, 29 
三 7 1. 60 0. 10 0, 3 | 3. 1. 0, 2. 34 
角 8 | 2.60 0.08 0， 1 1. | “306 4， 0， 0. 1. 91 
洲 9 | 2.14 0, 06 0. 1 1 | 0. 4， 0. 0， 1. 56 
10 | 1.25 0. 05 0. 1 1 | 0. 3， 1, 0. 2. 46 
11 | 1.22 0. 06 0, 1 1 | 0. 4， 1. 0. 1. 73 
12 | 6.14 0. 10 0， 1 1 | 0. 3. 0. 0， 2.61 
13 | 1.50 0. 10 0， 3 1 | 0. 3. 0. 0, 1. 75 
14 | 3.00 0. 35 0, 2 1 10. 3. 0， 0, 2. 61 
15 | 4.90 0. 30 0. 1 1 | 0. 3. 0, 0, 2. 41 
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Fi(X) 一 6.244 2M, 十 4.474 6c 一 4.019 2Si 十 11.018 0k, 一 24.847 2 (三 角 洲 相 ) 
F, (六 ) 一 4.979 21M, 十 7.583 4c 十 0.922 1S4 十 8.310 4k, 一 22.0130 ( 浊 流 相 ) 
F,( 累 ) 一 6.419 9M, 十 8.155 lc 十 1.433 5Su 十 9.612 4& 一 31.312 9 (风暴 流 相 ) 
对 于 上 述 判 别 函 数 来 说 ,无 论 是 对 表 5-3 中 样品 的 判别 检验 效果 ,还 是 在 研究 东 濮 凹陷 
西部 沙 三 段 沉积 相 时 的 使 用 情况 , 均 反 映 出 成 分 成 熟 度 参 数 判 别 效 果 优 于 粒度 参数 判别 效 
果 。 其 原因 在 于 粒度 参数 比 成 分 成 熟 度 参 数 更 上 其 多 解 性 , 即 沉 积 物 的 粒度 受 沉积 环境 水 动 
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力 条 件 的 控制 ,但 不 同 的 沉积 环境 可 具有 相似 的 水 动力 条 件 。 由 此 表明 ,定量 研究 地 质问 题 
时 ,地 质 参数 的 选择 是 非常 重要 的 ,应 该 尽 可 能 地 选择 那些 地 质 含 义 明确 ,代表作 用 强 的 参 
数 ,否则 ,无 论 多 么 完善 的 数学 方法 也 不 能 使 地 质问 题 得 到 满意 的 解释 。 

kK 例 4 预报 油气 勤 换 成 功率 。 

四 川 盆地 侏 罗 系 自流 井 群 大 安 寨 组 评价 区 划分 为 675 个 单元 (参见 回归 分 析 应 用 实例 
中 的 【 例 11) 。 在 675 个 单元 中 ,有 钻探 资料 的 单元 有 139 个 ,其 中 57 个 单元 获得 了 工业 油 
气井 ,把 这 些 单元 记 为 A 组 ,其 勘探 成 功率 为 1; 未 获得 工业 油气 井 , 经 过 研究 认为 也 不 可 能 
获得 工业 油气 井 的 单元 有 38 个 ,把 这 些 单元 记 为 B 组 ,其 勘探 成 功率 为 0。 以 14 个 地 质变 
量 对 两 组 单元 作 逐 步 判 别 分 析 , 取 户 = 户 =2, 得 到 勘探 成 功率 为 1 的 A 组 的 判别 函数 
Fa( 系 ) 和 勘探 成 功率 为 0 的 B 组 的 判别 函数 下 s (X): 

Fa(X) = 1.391 1 X10 ?z+t3.830 0X10 ?zs 二 1.6138X10 x 
十 5.271 3X107!zxs 十 8.909 3X10 zx 一 34.9155 
Fs(X) = 1.795 6 X10 ?x 二?7.663 0X 10 xs 二 2.1202X10 x 
十 2.910 7 X10 zs 十 3.244 1 X10 zx;—37.3755 
选 人 的 变量 zz ,zs，7z4 属于 构造 因素 , 变 


量 zs 代表 生 储 盖 条 件 的 搭配 ,而 7 代表 生 区 

储 条 件 。 上 述 五 个 变量 的 组 合 反映 了 受 岩 性 yy 

岩 相 控制 的 裂缝 性 油气 藏 的 特征 。 
利用 Fa(X) ,Fs(X) 对 A,B 两 组 单元 的 pp 


加 判 结果 为 ;A 组 的 57 个 单元 判 对 了 54 个， 多 
B 组 的 38 个 单元 判 对 了 36 个 ,对 判 率 大 于 “二 bp 
94%% ,判别 函数 是 高 度 显著 的 。 时 
将 评价 单元 对 应 的 五 个 变量 值 代 人 | 
F(X) ,计算 出 属于 A 组 的 后 验 概率 ,也 就 是 。 心 Wm 
单元 的 勘探 成 功率 ,在 此 基础 上 绘 出 勘探 成 
功率 预测 等 值 线 图 (图 5-5) 。 结 合 其 他 资料 ， 
应 在 此 图 上 选择 成 功率 相对 高 的 区 块 勘探 。 
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图 5-5 大 安 赛 组 勘探 成 功 概率 预报 图 
〈 据 陈 立 平 , 陈 子 恩 ) 


思考 与 练习 
. 什么 是 判别 分 析 ? 
， 斌 述 建 立 线性 判别 函数 的 费 软 尔 准 则 。 
， 如 何 利用 线性 判别 函数 对 样品 所 属 的 总 体 做 出 判别 ? 
. 试 述 Bayes 准则 下 建立 多 总 体 判 别 一 般 判 别 函 数 的 基本 原理 。 
. 逐步 判别 分 析 为 何 提出 ? 
. 试 述 逐步 判别 分 析 的 基本 思想 。 : 
.已 知 总 体 数 G 二 4, 样 品 总 数 n 二 42, 逐 步 判别 分 析 共 引入 变量 数 pp 二 3, 计 算出 的 统 





得 五 徐 狮 别 分 析 






计量 下 一 2.5, 给 定 检验 水 平 一 0.05, 试 检验 判别 函数 的 显著 性 。 

8， 对 于 [ 例 3] 中 的 成 分 成 熟 度 和 粒度 数据 ,试用 未 步 判 别 分 析 程 序 求 三 角 洲 、 浊 流 和 风 
暴 流 沉积 相 的 判别 函数 ,给 定 检 验 水 平 一 0. 1, 检 验 所 求 判 别 函 数 的 显著 性 ,并 确定 取 自 上 
述 沉 积 相 的 样品 六 =(3. 67,0. 07,0. 01) ,一 (1.97,0. 20,0.02),Z=(1. 58,0.13,0. 11) 的 


沉积 相 。 
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第 六 章 ”趋势 面 分 析 


任何 一 个 地 质变 量 z, 如 地 层面 的 埋藏 深度 .地 层 
的 厚度 . 储 层 中 油气 的 粘度 和 比重 .地 层 水 的 矿 化 度 、 
油气 地 表 地 球 化 学 勘探 指标 等 ,其 观测 值 之 ; 与 观测 扣 
的 地 理 坐 标 (xz; ,yi) 一 起 构成 三 维 空间 中 的 点 ,将 其 记 
为 M(xri, yi,zi) (i 二 1,2,…,n) ,趋势 面 分 析 就 是 在 这 
个 点 的 控制 下 , 拟 合 一 个 连续 的 数学 曲面 ,以 此 研究 
地 质变 量 在 区 域 上 和 局 部 范围 内 变化 规律 的 一 种 统 
计 分 析 方 法 。 拟 合 出 的 数学 曲面 叫做 趋势 面 ,表示 地 
质变 量 的 变化 趋势 。 地 质变 量 的 观测 值 分 布 在 趋势 





。 实 测 皮 或 实测 点 在 趋势 面 上 的 投影 


大 


面 上 或 者 它 的 上 下 附近 (图 6-1)。 在 趋势 面 分 析 中 ， a 
多 项 式 和 传 里 叶 级 数 是 常用 的 数学 模型 ， 


S91 多项式 趋 势 面 分 析 
一 、 多 项 式 曲 面 的 一 般 形式 
多 项 式 曲 面 的 一 般 形式 为 : 
zz 一 Qi 十 azZz 十 ay 十 az22 十 asxy 十 aoy: 十 … (6-1) 
式 中 ”2z 一 一 地 质变 量 ， 
Zz,y 一 一 观测 点 的 地 理 坐 标 ; 
ayazyag 一 一 符 定 常数 与 系数 。 
如 采 式 (6-1) 中 自 变量 的 最 高 次 数 为 上 , 则 称 式 (6-1) 为 上 次 多 项 式 曲面 。 曲 面 的 形态 
将 随 着 的 增 大 而 变 得 更 加 复杂 (图 6-2) 。 








图 6-2 多 项 式 趋势 面 示意 图 
二 、 多 项 式 系 数 的 个 数 及 系数 的 确定 
1. 多 项 式 系 数 的 个 数 


对 于 上 次 多 项 式 ,其 系数 与 常数 项 的 个 数 p= 二 (十 1)(& 十 2) /2， 
2。 多项式 系数 的 确定 
具 









we 统 亢 音效 切面 分 析 


系数 和 常数 项 。 


设 位 1 su? ,aa 的 估计 值 为 bi ,DO» Oa 9 那么 趋势 多 项 式 方程 为 : 


2 二 下 十 byx 十 bsy 十 Bax? 十 bsxy 十 boy 十 …… (6-2) 
把 观测 点 的 地 理 坐 标 Czxi,yi) (i 二 1,2,…,n) 代入 式 (6-2) ,得 观测 点 上 地 质变 量 的 趋势 
值 : 
2 = 十 baxi 十 bsy; 十 Box? 十 bsxiyi 十 bey? 十 … (6-3) 
如 果 统 计量 


i 一 > (ey 之 ;2 
i=1 


达到 最 小 ,表明 观测 值 与 趋势 值 最 接近 。 由 Q, 可 知 , 它 是 关于 刀 , 如 ,6… 的 一 个 二 次 函数 ， 
并 且 Qi >0 ,根据 极 值 原理 有 : 


aQ 
9 


式 中 pp 一 一 多 项 式 系 数 与 常数 项 的 个 数 。 
从 式 (6-4) 可 以 解 出 ,bs ,5b，… ,得 到 趋势 多 项 式 方程 式 (6-2)，。 
对 式 (6-4) 化 简 整 理 , 写 成 矩阵 形式 有 
4B 一 C (6-5) 
并 称 式 (6-5) 为 正规 方程 组 ;从 中 可 以 解 出 5 ;6,6;… ,得 到 趋势 多 项 式 方程 式 (6-2)。 其 中 
A=XX,C—XZ,Z—= (zz 2 ) 1 B= Cb ,bs ,bs) 





一 0 (k=1,2,.…,p) (6-4) 


2 2 3 2 2 
l 1 VY1 i iYyi V1 wl IYI TI YI V1 


2 2 2 2 
] ZX yy Ta dry Yl Za Xiys To Ys 


| 
三 、 趋 势 面 的 拟 合 度 
趋势 面 的 拟 合 度 是 指 观测 点 上 的 观测 值 与 趋势 值 在 总 体 上 的 逼近 程度 。 如 果 记 
Q= Oa) QQ 一 >)(2 一 2 
定义 趋势 面 的 拟 合 度 为 : 
C= (Q/Q) Xx 100% 
四 、 趋 势 面 偏差 图 
偏差 是 地 质变 量 的 观测 值 z; 与 趋势 值 2, 之 差 ， 
即 Az; 二 z; 一 z;。 趋 势 面 偏差 图 是 以 偏差 为 绘图 数据 
绘制 的 等 值 线 图 (图 6-3)。 在 偏差 图 上 ,偏差 大 于 0 
的 等 值 线圈 出 的 区 域 称 为 正 偏 差 区 ( 正 剩余 区 、 正 残 
差 区 ) ,偏差 小 于 0 的 等 值 线 圈 出 的 区 域 称 为 负 偏 差 
区 (人 负 剩 余 区 、 负 残 差 区 )。 关 于 正 、 负 偏差 的 地 质 解 
释 ,要 依据 偏差 的 地 质 内 涵 进 行 具 体 分 析 。 例 如 , 若 
地 质变 量 是 地 层面 埋藏 深度 的 绝对 值 ,那么 偏差 图 上 | 
的 正 偏差 区 在 某 种 意义 上 是 放大 了 的 局 部 洼 陷 , 而 负 图 6-3 二 次 趋势 面 偏差 等 值 线 图 
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偏差 区 则 意味 着 局 部 突起 。 分 析 这 种 偏差 对 研究 盆地 的 油气 分 布 和 查找 隐蔽 圈 闭 是 非常 有 
益 的 。 

五 、 趋 势 面 异常 图 

通 党 来 说 ,任何 地 质变 量 z 的 观测 值 z; 由 区 域 性 趋势 (背景 ?分量 w、 局 部 特征 (局 部 寞 
常 ) 分 量 v; 和 随机 干扰 分 量 ~ 三 部 分 组 成 , 即 : 

LA 

式 中 就 是 趋势 值 2; ,而 vi 十 r; 则 是 偏差 Az;。 由 此 可 知 ,车 直接 由 偏差 来 研究 、 分 析 变 量 
z 的 局 部 特征 , 则 会 受到 7; 的 影响 ,降低 研究 结果 的 可 靠 性 。 所 以 ,在 进行 偏差 分 析 时 ,最 好 
把 Az 中 包含 的 r, 消除 或 者 对 其 进行 抑制 。 在 实际 计算 中 , 常 取 m 个 正 偏差 Az; 的 平均 
值 


或 者 标准 老 





的 2 倍 作为 随机 分 量 的 估计 值 ,并 称 其 为 异常 限 。 

从 正 偏差 Azt+ 中 划分 正 异常 时 ,异常 限 为 正 值 ,并 称 其 为 异常 下 限 。 异 常 下 限 确 定 后 ， 
称 Azt+ >e( 或 20) 的 点 为 正 异常 点 ,该 点 的 异常 值 为 ; 

vy 二 Azi 一 e 或 者 v; = 二 Azt — 20 

从 负 偏 差 Azi 中 划分 负 蜡 常 时 ,异常 限 为 负 值 ,并 称 其 为 异常 上 限 。 蜡 常 上 限 确定 后 ， 

称 AZ; 二 一 e( 或 一 20) 的 点 为 负 异 常 点 ,该 点 的 异常 值 为 ; 
v; 二 Azi 十 Ee 或 者 v; = 二 Azi 十 20 

异常 点 确定 后 ,根据 异常 下 、 上 限 可 以 在 偏差 图 上 轿 出 正 \、 负 异常 区 ,也 可 用 异常 把 的 寞 
常 值 绘制 等 值 线 图 ,并 把 该 等 值 线 图 称 为 趋势 面 异常 图 。 

值得 注意 的 是 :这 里 的 异常 限 是 一 个 统计 估计 值 ,并 非 各 点 上 的 随机 分 量 值 。 因 此 , 它 
是 一 个 可 以 改变 的 量 。 在 实际 工作 中 ,可 以 根据 资料 的 实际 情况 和 要 求 ,改变 它 的 大 小 ,使 
异常 和 随机 分 量 得 到 最 佳 的 分 离 。 

六 、 关 于 趋势 面 的 次 数 

利用 趋势 面 分 析 的 方法 研究 地 质变 量 在 区 域 上 和 局 部 范围 内 的 变化 规律 时 ,究竟 采用 
多 少 次 的 多 项 式 合 适 ? 即 多 项 式 的 次 数 & 取 多 大 为 宜 ? 

确定 & 的 方法 如 下 : 

方法 1: 对 地 质变 量 进行 一 次 .两 次 ………' 趋 势 面 分 析 , 相 应 的 拟 合 度 为 Ci ,Cs，…, 在 &C 
坐标 系 内 作 &,C 的 散 点 图 (图 6-4)。 连 接 各 点 形成 一 条 折线 ,在 
折线 上 取 和 斜率 最 大 的 线段 对 应 的 六 作为 趋势 面 的 次 数 。 

方法 2: 对 地 质变 量 进行 一 次 .两 次 、…… 趋势 面 分 析 , 相 应 的 
拟 合 度 为 C1 ,Cs，…。 对 预先 给 定 的 小 正 数 s, 当 Cr 一 C<e 时 ， 
取 C; 对 应 的 & 作为 趋势 面 的 次 数 。 


C 


图 6-4 选择 上 示意 图 


铸 亢 关 赵 狼 面 分 煌 





S 2 调和 趋势 面 分 析 


调和 趋势 面 分 析 的 方法 原理 及 研究 过 程 与 多 项 式 趋 势 面 相同 ,不 同 之 处 仅 是 它 采 用 的 
数学 模型 为 侍 里 叶 级 数 。 因 此 ,本 节 在 多 项 式 趋 势 面 分 析 的 基础 上 , 仅 作 如 下 说 明 。 

一 、 正 弦 波 的 调和 与 全 加 

1, 正弦 波 的 调和 

正弦 波 

一 asin(wz 十 0) (6-6) 

是 最 简单 的 波 (图 6-5) ,其 波长 4 二 2x/w。 
式 中 gg 一 一 初 相位 ; 





w- 一 一 角 频 率 ; 
a 振幅 ; 
Xz 一 一 自 变 量 。 





展开 式 (6-6) 得 : 


图 6-5 正 弱 波 示 意图 


z= a Sin (wr 十 9) 一 a sin oOcos wr a COS psln wx 


= A cos wr B sin wr (6-7) 
由 式 (6-7)? 可 知 :单一 的 正弦 波 可 以 分 解 为 正弦 波 与 余弦 波 的 和 ,反之 可 写 为 单一 的 正 
弱 波 。 
一 维 调和 是 式 (6-7)? 给 出 的 正 艾 波 , 当 w 王 2Rr/A 时 , 即 
z, = CSIn〔(2&TrrAAD) 
时 称 为 一 维 & 阶 调和 , 它 的 波长 等 于 AM/R。 
二 维 调 和 是 以 z,y 为 自 变 量 的 正弦 ( 余 艾 ) 函 数 的 积 , 即 
acos wrcos vy, bsin wrcos vy, ccogs wrsin vy, dsin wisin vy (6-8) 
当 式 (6-8) 中 ww 二 2mr/ 和 ,v0 二 2nx/Ahs 时 , 称 式 (6-8) 为 二 维 束 ,nn 阶 调和 。 
2. 正弦 波 的 党 加 
把 振幅 相同 或 不 同 的 一 维 调 和 个 加 起 来 , 则 可 形成 各 种 复杂 的 曲线 。 同 理 ,多 个 简单 二 
维 调和 的 全 加 , 便 构 造 出 形态 复杂 的 曲面 (图 6-6)。 
二 、 调和 趋势 面 
二 元 傅 里 叶 级 数 是 二 维 调 和 的 线性 组 合 , 它 的 一 般 形式 为 : 
z= F(zr,y) = >， >,[LEacos(2txzx/L)cos(2kry/H) 十 Casin(2trz/ 工 )cos(2&ryy/ 万) 


1=0 一 0 
+ Pycos(2tnxr/L)sin(2kry/H) + Wasin(2trrx/L)sin(2krny/ 五 ) | 
(6-9)» 
拟 合 调和 趋势 面 就 是 根据 点 Mi《zi ,yi,zi) (i 二 1,2,…,n), 按 最 小 二 乘法 原理 ,确定 式 
(6-9) 中 Ey ,Cn ，Pn ,Wi 的 估计 值 a ,bn ,cn du 得 到 方程 ， 


z= 下 (zyy) = 》) > [auncos(2trz/ 了 L)cos(2kry/ 百 ) + ba sin(2inz/L)cos(2kny/H) 


t=0 k=0 


+ cuacos(2tnr/L)sin(2kny/ H)+ dy sin(21rr/L)sin(2kry/ H) | 
(6-10) 
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一 维 一 阶 调和 一 维 二 阶 调和 


一 维 三 阶 调和 一 维 一 阶 与 二 阶 调和 又 加 





一 维 调和 琶 加 曲面 


一 维 一 阶 与 三 阶 调和 生 加 


图 6-6 正弦 流 的 亚 加 曲线 与 曲面 
级 数 趋 势 值 ; 








式 中 








L 一 一 zx 方 同 的 取样 长 度 , 即 原 图 的 横向 长 度 ， 


及 一 一 y 方向 的 取样 长 度 , 即 原 图 的 纵向 长 度 。 
由 式 \6-10) 可 知 , 调 和 趋势 面 分 析 不 仅 具 备 多 项 式 趋 势 面 分 析 的 功能 ,而 且 具 有 明显 的 


波动 特征 。 因 此 , 它 可 以 更 有 效 地 分 离 那些 呈现 出 周期 性 不 严格 的 地 质变 量 ( 如 地 层面 的 波 
状 起 伏 .沉积 旋回 、 地 球 磁 场 的 变化 等 ) 的 趋势 和 异常 ,进而 研究 地 质变 量 的 波动 特征 ， 


S3 应 用 实例 
【 例 13 寻 找 有 利 油 气 储 集 构 造 。 
油气 田 勘 探 实践 表明 , 受 构造 因素 控制 的 油气 藏 占有 相当 大 的 比重 。 但 是 ,采用 传统 的 
质 方法 研究 构造 与 油气 藏 的 关系 时 ,有 些 局 部 构造 ,特别 是 低 幅 度 的 局 部 构造 常常 被 区 域 
性 构造 的 展 布 特性 所 掩盖 。 趋 势 面 分 析 方 法 能 够 突出 局 部 异常 ,为 寻找 油气 田 提供 新 的 参 
Shak A 区 域 性 的 问 西 倾 斜 的 单 斜 ,其 
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上 最 大 的 局 部 圈 闭 高 度 较 小 ,似乎 不 会 形成 大 的 油气 藏 。 在 地 层面 顶 面 构造 二 次 趋势 面 异 
常 图 (图 6-7) 上 ,存在 大 面积 的 正 异 常 区 ,并 且 已 探 明 的 洛斯 特 普 林 油 田 基本 上 分 布 在 正 异 
常 区 内 (图 6-8)。 





图 6-7 二 次 趋势 面 蜡 常 图 6-8 洛斯 特 普 林 油 田 ( 黑 色 ) 
( 据 Merriam 和 Harbaugh,1964) ( 据 Merriam 和 Harbaugh,1964) 


图 6-9 是 另 一 个 用 构造 趋势 面 异常 研究 堪萨斯 州 东 南 地 区 (地 区 工 ) 正 异常 与 油气 田 分 
布 关 系 的 实例 ,大 多 数 油气 田 位 于 正 异 常 区 内 。 尽 管 油气 的 聚集 与 多 种 因素 有 关 , 但 趋势 面 
异常 图 仍 可 为 油气 勘探 提供 一 些 参 考 信息 ,如 指出 局 部 的 特别 是 低 幅 度 构 造 油气 藏 的 潜在 
地 区 。 值 得 注意 的 是 :不 能 仅 赁 着 趋势 面 分 析 结 果 而 做 出 地 质 结 论 ,而 应 该 综合 其 他 地 质 资 
料 进行 全 面 的 地 质 解释 , 既 要 重视 正 异 常 区 的 有 利 部 位 ,也 不 能 忽视 负 异 常 区 的 有 利 地 带 ， 
因为 在 负 异 常 区 可 能 找到 岩 性 和 地 层 油气 藏 。 





(a) 异常 等 值 线 图 (b) 圣 带 状 砂岩 油气 田 分 布 图 


图 6-9 勘 萨 斯 州 东 南 地 区 (地 区 工 ) 构 造 二 次 趋势 异常 和 油气 田 分 布 图 
( 据 Merriam 和 Harbaugh,1964) : 
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【 例 23 寻 找 岩 性 -构造 油气 藏 。 

酒泉 盆地 北部 单 斜 带 经 过 多 年 勘探 ,在 第 三 系 火 烧 沟 群 先 后 发 现 了 日 杨 河 . 单 北 和 曰 东 
三 个 油田 。 在 分 析 认 识 已 有 资料 的 基础 上 ,试图 利用 趋势 面 分 析 方 法 在 该 单 斜 构造 上 寻找 
郑 性 -构造 油气 藏 。 

火烧 沟 群 构造 为 一 由 北向 南西 倾斜 的 平缓 单 斜 , 其 上 有 人 少数 几 个 鼻 状 构造 和 腑 状 气 曲 。 
在 一 次 趋势 面 图 上 ,该 群 顶部 构造 背景 为 一 南西 12 倾斜 的 平面 ,倾角 为 116 。 在 构造 异常 
图 (图 6-10) 上 明显 看 出 ,已 探 明 的 油田 全 部 位 于 正 异 常 区 ,说 明 构 造 因 闪 在 控制 油气 上 占 
有 重要 地 位 。 但 是 白杨 河 与 白 东 油田 并 不 在 正 异常 区 的 最 高 部 位 ,而 是 在 斜坡 上 或 个 近 正 
异常 的 边界 处 ,这 说 明 它 们 除 受 构造 因素 控制 外 ,还 受到 岩 性 变化 的 制约 (油层 上 倾 方 回 物 
性 变 差 ) ,是 典型 的 岩 性 -构造 油气 藏 。 由 此 得 出 : 正 异 常 区 地 层 上 倾 方向 的 低 渗透 带 是 有 利 
的 构造 部 位 。 基 于 上 述 认 识 , 提 出 几 块 有 利 面积 ,经 初步 勘探 ,在 A,B,E 三 块 面积 内 发 现 了 
好 的 油 砂 或 工业 性 油 流 。 
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图 6-10 酒 果 盆地 北部 单 斜 带 第 三 系 火烧 沟 群 顶 
一 次 趋势 而 异常 等 值 图 和 有 利 区 预测 图 
( 据 陈 立 官 主编 4 油气 田地 下 地 质 学 》,1983) 


【 例 3 研究 地 下 断裂 分 布 。 

把 局 部 异常 和 随机 干扰 从 数据 中 分 离 出 来 ,以 期 从 中 找 出 隐藏 的 或 者 被 掩盖 而 又 有 意 
义 的 地 质 信 息 。 岩 体 顶 面 的 起 伏 虽 有 较 大 的 随机 性 ,但 往往 是 连续 变化 的 ,然而 构造 断裂 所 
造成 的 起 伏 则 有 线 状 分 布 .方向 性 明显 和 非 连续 的 特点 。 这 些 特点 是 地 下 断裂 能 够 通过 趋 
势 面 分 析 加 以 显示 的 前 提 条 件 。 

由 于 趋势 图 描绘 了 大 范围 的 总 体 变化 ,而 偏差 图 则 包含 了 小 范围 的 局 部 特征 和 无 规律 
的 随机 成 分 。 因 此 ,对 偏差 值 再 进行 分 解 , 可 得 到 次 一 级 的 趋势 值 和 偏差 值 。 因 为 第 一 次 趋 
势 图 已 将 背景 分 离 出 去 ,于 是 第 二 次 处 理 的 数据 基本 上 不 包含 主要 的 区 域 性 分 量 了 ,尤其 是 

在 拟 合 度 偏 高 的 情况 下 更 是 如 此 。 因 此 ,第 二 次 的 趋势 图 表现 了 小 范围 的 变化 特征 ,而 偏差 
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图 则 更 集中 地 反映 了 更 小 的 局 部 特征 和 随机 成 分 。 呈 线 状 分 布 , 且 有 一 和 证 方向 性 的 断裂 必 
然 要 在 第 二 次 趋势 面 偏差 图 中 反映 出 来 。 
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(c) 五 次 趋势 面 剩余 值 的 七 次 偏差 图 


图 6-11 某 研 究 区 地 质 及 趋势 面 偏差 图 
1 一 寒 武 纪 地 层 ;2 一 花岗岩 ;3 一 张 性 . 张 扭 性 断裂 及 编号 ;4 一 压 性 . 压 扭 性 断裂 及 编号 ; 
5 一 岩 体 与 围 岩 接触 界线 ;6 一 数据 点 分 布 范围 ;7 一 候 差 等 值 线 ;8 一 正 偏差 区 ;9 一 负 俩 差 区 ; 
10 一 已 知 断 裂 ;11 一 趋势 面 分 析 预 铀 断裂 ;12 一 剖面 线 位 置 及 编号 
( 据 陈 立 官 主编 《油气 田地 下 地 质 学 》,1983) 

在 据 某 地 区 寒 武 系 地 面 资 料 绘制 的 断裂 分 布 图 (图 6-11a) 和 该 区 五 次 趋势 面 偏差 图 
《图 6-11b) 上 ,可 以 明显 看 出 区 内 两 条 NEE 走向 的 大 断裂 非常 吻合 。 但 图 6-11b 上 最 醒目 
之 处 是 中 央 的 SN 向 正 偏差 区 等 值 线 梯度 变化 特别 大 ,使 人 们 训 不 怀疑 这 里 潜藏 着 一 条 向 
东 倾 斜 的 断裂 ,但 它 在 地 面 地 质 图 上 却 没 有 反映 。 后 经 钻探 证 实 , 该 区 深部 确实 存在 这 条 较 
大 的 断裂 。 最 富有 说 服 力 和 令 人 感 兴趣 的 是 五 次 趋势 面 偏差 值 的 七 次 偏差 图 (图 6-11c, 它 
是 对 五 次 趋势 面 偏差 值 又 进行 七 次 趋势 面 分 析 后 作 的 七 次 偏差 图 ) ,从 已 知 断 裂 部 位 等 值 线 
的 方 回 性 ,梯度 变化 , 正 、 负 偏差 值 的 界线 看 ,都 非常 吻合 ,甚至 有 些 部 位 把 呈 平 行 带 状 出 现 
的 断裂 更 准确 .更 细致 地 反映 出 来 了 。 从 此 例 不 难看 出 ,趋势 面 分 析 对 断裂 构造 的 研究 是 一 
种 很 有 效 的 方法 。 一 般 情况 下 ,在 趋势 面 偏差 图 上 ,等 值 线 排列 的 方向 性 .规模 大 小 和 梯度 
的 变化 反映 地 下 断裂 及 其 产 状 , 尤 其 对 具有 一 定 规模 和 垂 向 位 移 较 大 的 断裂 ,效果 会 更 好 。 

胜利 油田 地 质 科 学 研究 院 对 标准 层 标 高 进行 趋势 面 分 析 , 在 趋势 面 正 偏 差 区 查找 低 幅 
度 构造 圈 闭 ,增加 了 石油 地 质 储量 ,同时 指出 :偏差 图 上 的 等 值 线 密集 带 , 往 往 是 断裂 分 布 的 
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位 置 ,密集 等 值 线 的 方向 指示 了 断层 的 延伸 方 四 。 


【 例 4 预测 有 利 勘 探 区 。 

利用 地 震波 通过 含油 气 层 时 高 频 成 
分 被 强烈 吸收 ,而 低频 能 量 相 应 增强 的 特 
征 反 演 预测 有 利 含油 区 的 方法 称 为 HCl 
( 碳 氢 检测 ) 技 术 。 这 种 技术 可 提供 多 种 
资料 , 碳 氢 检测 地 震 特 征 图 (图 6-12) 和 
碳 氧 检测 地 震 综合 图 (图 6-13) 是 其 中 的 
两 种 。 

地 震 特 征 图 由 速度 变化 特征 、10 Hz 
宽带 能 量 百分比 .10 Hz 能 量 、 平 均 频率 
特征 .宽带 能 量 特征 (能 谱 ) 及 峰值 频率 特 
征 等 六 种 地 震 信 息 组 成 。 大 量 资 料 表 明 ， 
在 地 震 特 征 图 上 ,有 利 含 油气 层 段 明显 地 
反映 出 10 Hz 宽带 能 量 百 分 比 .10 Hz 能 
量 .宽带 能 量 特征 等 指标 (图 6-12 中 的 2， 
3,5) 增 强 ,速度 变化 .平均 频率 及 峰值 频率 
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IEU 。 
对 勘探 目的 层 及 其 顶 和 底 进行 HCI 
处 理 , 获 得 储 层 各 自 的 地 震 特征 图 后 ,再 将 





图 6-13 ” 碳 氢 检测 地 震 综合 图 


各 层 的 总 值 绘制 在 一 张 图 上 , 即 形成 碳 氢 检测 地 震 综合 图 。 

1982 年 ,石油 地 球 物理 勘探 局 第 四 勘探 公司 在 哈 南 地 区 选用 了 四 条 HCI 剖面 ,对 400 
个 观测 点 的 地 震 综 合 信息 进行 计算 ,反映 上 下 中 三 层 目的 层 检测 效果 ,绘制 了 哈 南 地 区 
HCI 三 次 趋势 面 偏差 值 的 四 次 趋势 面 图 (图 6-14), 图 上 显示 出 两 个 正 偏差 区 。 东 区 呈 
NNE 走向 ,是 一 个 以 正 值 症 4 的 南北 两 高 点 的 但 


差 区 , 自 高 点 向 楼 部 ( 短 轴 方向 ) 旦 每 干 米 递减 4 
的 比率 。 西 区 整体 亦 呈 NE 向 ,面积 约 为 东区 的 
两 倍 , 主 体 在 北部 ,是 一 个 高 点 正 值 定 4. 圈 财主 体 
向 北 开 口 的 正 偏差 区 , 短 轴 方向 的 递减 比率 与 东 
区 相同 。 它 的 特点 是 向 西南 及 东部 均 有 平缓 延伸 


的 正 偏差 区 。 结 合 其 他 资料 ,拟定 东西 两 个 正 偏 医 
差 区 为 有 利 勘探 区 ， 

1984 年 以 来 在 相应 地 区 经 过 地 震 详 查 及 外 . 
探 ,发 现 了 哈 南 油田 和 蒙古 林 油 田 。 在 东区 发 现 
了 一 个 NE 走向 ,由 夫 特 西 . 哈 南 、 布 敦 北 、 额 汉 南 
四 个 构造 组 成 .面积 为 ?0 km 的 潜 山 背 斜 构造 
带 。 在 哈 南 构造 上 的 哈 1 井 、 哈 8 井 均 已 见 到 自 








6-14 ” 哈 南 地 区 HCI 三 次 趋势 面 偏差 值 
的 四 次 趋势 面 图 
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宕 ,表明 是 一 个 复式 油 藏 。 在 西区 主体 部 位 发 现 了 一 个 多 高 点 背 斜 构造 ,经 地 震 和 和 钴 探 证 实 
是 一 个 具有 较 大 面积 .多 套 储 层 、 较 多 地 质 储 量 的 复式 油 藏 。 


I Ea 练 习 
. 简 述 趋势 面 分 析 的 概念 及 研究 对 象 。 
. 简 述 多 项 式 趋势 面 与 调和 趋势 面 在 应 用 上 的 异同 。 
. 试 述 求 趋势 面 方 程 的 方法 原理 。 
如 何 选 择 趋 势 面 的 拟 合 度 ? 
如 何 绘制 趋势 面 偏 差 图 和 异常 图 ? 
如 何 解释 趋势 面 偏 差 图 和 异常 图 的 地 质 含义 ? 
.熟悉 二 维 一 次 、 二 次 、 三 次 多 项 式 趋势 面 模型 。 
. 趋势 面 分 析 与 回归 分 析 在 方法 原理 及 应 用 方面 有 何 异 同 ? 
9， 当 趋势 面 分 析 结 果 出 现 地 质变 量 不 可 能 出 现 的 结果 时 , 称 此 时 的 趋势 面 发 生 晨 变 。 
试 分 析 导 致 趋势 面 发 生 畸 变 的 原因 。 
10. 假设 茶 铜 矿床 的 矿 源 层 是 下 案 武 系 底 部 的 黑色 页 岩层 ,化 探 找 矿工 作 中 已 对 黑色 
页 岩层 等 间距 网 格 采样 ,并 分 析 了 样品 的 铀 元 素 含 量 ( 表 6-1)。 试 对 铀 元 素 含 量 作 一 次 趋 
势 面 分 析 , 并 据 分 析 结 果 预 测 铜 矿 的 有 利 成 矿区 。 
要 求 如 下 : : 
中 绘 出 一 次 趋势 面 图 ( 绘 5 条 等 值 线 )， 
ee 一 次 趋势 面 偏差 图 ; 
@@) 绘 出 异常 图 ,标示 咸 矿 有 利 区 ; 
(4) 如 有 林 更 换 和 采样 点 坐标 ( 表 6-2)， 对 趋势 面 分 析 结 果 是 否 有 影响 ? 为 什么 ? 


表 6-1 采样 点 坐标 及 样品 铜 元 素 含 量 单位 :5 表 6-2 采样 点 坐标 及 样品 铜 元 素 含量 单位 ;% 
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第 七 音 ” 因 于 分 术 
$1 因子 分 析 概述 


一 、 主 因子 
假设 有 个 样品 ,每 个 样品 有 m 个 变量 ,它们 的 原始 观测 值 记 为 数据 矩阵 : 
Tl1 X12 1 
XT2l X22 2 
We | 


当 mm 一 2 时 ,在 x1,xs 坐标 系 内 做 样品 的 散 点 图 (图 7-1)。 由 此 图 看 出 :在 xi ,xs 坐标 

系 内 ,两 个 变量 的 方差 差别 不 大 ,也 就 是 说 ,每 个 变量 所 提供 的 信息 都 不 可 忽视 ;将 ziyzs 坐 

标 系 旋转 为 户 , 户 新 坐标 系 , 在 新 坐标 系 内 ,两 个 变量 的 方差 却 有 明显 的 差别 , 放 i 的 方差 占 

了 总 方差 的 绝 大 部 分 。 由 此 表明 ,变量 fi 能 够 反映 原始 数据 所 包含 的 绝 大 部 分 信息 。 根 据 
坐标 旋转 变换 ,上 述 变量 间 的 关系 为 : 

fi = anzxi tax Zl 一 anfitt arf: 

全 = asl fi azf? 


Tm 


(7-1) 


fo 一 Qi 十 CozZs 





图 7-1 主因 子 示意 图 
当 fs 的 方差 小 于 允许 误差 时 , 它 就 失去 了 存在 的 必要 ,此 时 就 可 用 fi 代替 两 个 原始 变 
量 ,而 式 (7-1) 改 为 : 
fi 一 Qixi 十 Ga2iTs 或 Xi = an fi ae: (71S L522) (7-2) 
其 中 e; 服从 均值 为 0, 方差 为 of 的 正 态 分 布 。 
如 采 每 个 样品 有 m 个 变量 ,仿照 式 (7-1) 可 得 : 
fi = auxitarzs tanztn ri = anfitazfit anfnli = 1,2,.,m) 
(7=3) 
由 坐标 旋转 可 知 , 式 (7-3) 中 系数 的 平方 和 满足 : 


> 一 1 GG=1,2,.,m) 
一 | 
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把 m 个 原始 变量 表示 为 p 个 主因 子 的 线性 组 合 , 当 p 二 mm, 特别 是 p 二 2 时 ,就 可 以 把 高 
维 空间 中 研究 的 问题 降 到 二 维 空 间 中 分 析 , 从 而 化 简 研 究 系 统 。 

二 、 因 子 分 析 

因子 分 析 是 研究 变量 间 相 关 性 .样品 间 相 似 性 、 两 者 成 因 联 系 以 及 探索 它们 之 间 产 生 上 
述 关系 的 内 因 的 一 些 多 元 统计 分 析 方 法 的 总 称 。 因 子 分 析 的 任务 之 一 就 是 找 出 p(p=m) 
个 主因 子 , 以 此 化 简 研 究 系 统 。 根 据 研 究 对 象 , 因 于 分 析 大 致 可 分 愉 型 \Q 型 因子 分 析 和 对 
应 分 析 。 

1, 及 型 因子 分 析 

R 型 因子 分 析 是 从 研究 m 个 变量 的 相关 (相似 ?系数 矩阵 


7 21 六 22 全 六 2 


的 内 部 结构 出 发 , 找 出 控制 变量 相关 性 的 主因 于 户 人 一 1 2， 71 ,把 变量 z; 表示 为 fi 的 
线性 组 合 , 即 ， 


rzi=afitazfs ti tamnf, (i = 1,2,"* ,1m) (7-4) 
其 中 : 
All dl2 im 
po Q21 Ggm 
Um dm2 SEN 
叫做 尺 型 因子 载荷 矩阵 。 


在 进行 综合 地 质 研究 时 ,如 果 用 前 p(p 志 mm) 个 主因 子 就 能 解释 原始 数据 80% 一 90% 

以 上 的 信息 ,那么 式 (7-4) 可 改写 为 : 
Ti 一 ad 六 十 ae 户 十 …… 十 ap 六 十 aiei (= 1,2,.,m) (7-5) 

上 式 表明 , 当 p< 之 m, 特 别 是 当 p= 二 2 时 ,将 极 大 地 化 简 研 究 系统 (在 二 维 空间 中 分 析 研 
究 高 维 空间 中 的 问题 ) ,可 更 进一步 探索 变量 的 成 因 联 系 及 其 空间 变化 规律 的 控制 因素 。 通 
常 称 式 (7-5) 为 R 型 因子 分 析 模 型 。 

2. Q 型 因子 分 析 

Q 型 因子 分 析 是 从 研究 2 个 样品 的 相似 (相关 系数 和 矩阵 

gu a2 gn) 

d21 dd22 "dar 


\ Gn qr … gm 
的 内 部 结构 出 发 , 找 出 控制 样品 相似 性 的 主因 子 f= 二 1,2,…,n) ,把 样品 zx; 表示 为 f; 的 
线性 组 合 , 即 ; : 

Ti = anfitanfi ianf (7 = 1,2,",n) (7-6) 
其 中 
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Ull dl2 Ul 
dz21 U22 U2n 
A * 
人 nl Cn? 人 
叫做 Q 型 因子 载荷 矩阵 。 
若 用 前 pCp 志 ) 个 主因 子 化 简 样 品 研究 系统 , 则 有 ，: 
Ti = anfitanzfe'' apfe tt oe 《7 一 1 2,…,77) (7-7) 
ee 7) 为 Q 型 因子 分 析 模 型 。 
公 因 子 


RS 各 变量 (或 样品 ) 中 公有 的 因子 户 ,fi，… ,fs 叫做 公 因 子 , 它 们 是 相 
互 独立 的 理论 变量 ,可 将 其 理解 为 p 维 空间 中 相互 垂直 的 p 个 坐标 轴 。 单 一 变量 (或 样品 ) 
中 特有 的 ee ) 叫 做 特殊 因子 ,它们 之 间 以 及 它们 与 所 有 公 因 子 之 间 都 是 相互 独立 的 。 

因子 载荷 矩阵 中 的 a; 是 第 i 个 变量 (或 样品 ) 在 f; 轴 上 的 负荷 。 

4. 对 应 分 析 

对 应 分 析 是 把 上 述 两 种 因子 分 析 方 法 结合 起 来 ,在 同一 一 个 空间 里 研究 样品 的 相似 性 、 变 
量 的 成 因 以 及 它们 的 分 布 规律 ,便于 进行 地 质 解释 的 一 种 多 元 统计 分 析 方 法 。 

由 上 述 可 知 ,进行 因子 分 析 的 关键 是 确定 因子 分 析 模 型 , 即 确 定 主因 子 载荷 矩阵 。 
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主因 子 载荷 矩阵 又 叫 主因 子 的 解 。 在 此 不 进行 理论 上 的 阐述 , 仅 从 应 用 的 角度 考虑 ,给 
出 因子 模型 中 的 主因 子 载荷 矩阵 。 
一 、R 型 主因 子 载荷 矩阵 及 主因 子 个 数 
1. 主因 子 载 贡 矩阵 
在 R 型 因子 分 析 中 , 设 变量 的 相关 系数 矩阵 R 的 特征 值 为 7 ,7 ，…)7w，* 并 且 满 足 x 之 
yz 之 … ' 宇 7 ,这 些 特征 值 对 应 的 特征 癌 量 为 Vi Van 耕 选 定 前 
p 个 主因 子 , 令 
Ai = Yi = 1,2,.…,p) 
U; = Va(i= 1,2,°",p) 
那么 可 以 证 明 前 p 个 主因 子 载荷 矩阵 为 : 
A WA 
相应 的 R 型 因子 分 析 模 型 为 式 (7-5)。 
由 上 述 可 知 ,如 果 R 型 因子 分 析 选 p 个 主因 子 , 那 么 A 是 相关 系数 矩阵 R 的 特征 值 
Yjt1(j 二 1,2,… ,pp) 的 平方 根 与 对 应 特征 癌 量 Vi 一 1 2 …) 力 ) 的 积 。 
2. 主因 子 个 数 
对 于 主因 子 来 说 ,各 主因 子 的 方差 贡献 S; 等 于 对 应 的 特征 值 , 即 : 


- 一 


用 JACOBI 法 可 求 出 相关 (相似 ) 系 数 短 阵 的 全 部 特征 值 和 单位 特征 向 量 。 夺 m 个 特 
征 值 从 大 到 小 排列 为 X41 ,X42,… ,4 ,计算 特征 值 累计 百分比 





往 七 着 因 池 分 析 





p mm 
C= D/AXI00% (pm) 
j= i=1 


然后 根据 C 确定 主因 子 数 p。 
二 、Q 型 主因 子 载荷 矩阵 及 主因 子 个 数 
1. 主因 子 载荷 矩阵 
在 Q 型 因子 分 析 中 , 设 样品 的 相似 系数 矩阵 Q 的 特征 值 为 7,,Y:,… ,7, ,并 且 满 足 7 之 
7 宇 … 主 yi 之 … 宇 7, ,这 些 特征 值 对 应 的 特征 向 量 为 VVsy Vpti sn。 若 选 定 前 p 
个 主因 子 , 令 
A; 一 Yi+Hl (j= 12，…， 力 ) 
U = Vi (i = 1,2,.",p) 
那么 可 以 证 明 前 p 个 主因 子 的 主因 子 载 荷 矩 阵 为 : 
My a pS Cy N/A Vs 
相应 的 Q 型 因子 分 析 模 型 为 式 (7-7)。 
2. 主因 子 个 数 
主因 子 个 数 的 确定 方法 参见 R 型 因子 分 析 ,注意 ， 


p n 
C= D/AXI00% (pn 
j=1 i=1 


$3 方差 最 大 正 交 旋转 


一 、R 型 因子 分 析 方 差 最 大 正 交 旋转 

确定 了 少 个 主因 子 , 即 确定 了 如 维 空间 ,此 时 还 要 对 主因 子 轴 进行 旋转 (图 7-2)。 对 于 
标准 化 变量 来 说 ,主因 子 轴 旋转 的 目的 是 使 第 ;7 个 公 因子 的 代表 性 变量 zx; 在 广 轴 上 的 系 
数 等 于 或 者 趋 近 于 1 ,而 在 其 他 公 因 子 轴 上 的 系数 等 于 或 者 趋 近 于 0, 以 便于 解释 主因 子 的 
地 质 意义 。 





图 7-2 因子 旋转 示意 图 


1, 方差 最 大 正 交 旋转 

实现 上 述 目 的 ,从 数学 上 讲 ,就 是 对 主因 子 载荷 矩阵 A, 实施 正 交 变换 。 常 用 的 旋转 方 
法 是 方差 最 大 正 交 旋 转 。 这 种 旋转 方法 使 p 个 主因 子 保持 彼此 正 交 ,并 且 使 因子 载荷 矩阵 
中 的 各 因子 载荷 平方 后 的 方差 达到 最 大 。 


对 于 R 型 因子 载荷 矩阵 4, 来 说 ,对 因子 f; 的 简化 效果 ,可 用 因子 载荷 平方 的 方差 
V = 1 Ym -Dy 


来 描述 。 其 中 b; 是 A 经 过 正 交 旋转 后 所 得 到 的 因子 载荷 矩阵 B 中 的 元 素 。 为 避免 出 现 仙 
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值 , 故 取 品 。 如 果 V; 达到 最 大 , 则 因子 f; 得 到 了 最 优 的 简化 。 此 时 , 公 因子 f; 的 代表 性 变 
量 在 f, 轴 上 的 系数 等 于 或 者 趋 近 于 1, 而 在 其 他 公 因 子 轴 上 的 系数 等 于 或 者 趋 近 于 0。 
对 p 个 因子 的 简化 效果 可 用 因子 载荷 平方 的 方差 之 和 


来 衡量 。 当 V 达到 最 大 时 ,p 个 因子 都 得 到 了 最 优 简 化 。 


考虑 到 诸 公 因子 对 变量 总 方差 贡献 的 差异 ,将 式 (7-8) 中 的 好 除 以 有 ,并 对 该 式 两 边 乘 
以 m 化 简 , 记 为 : 


p m pp mh 
Vi= mB/ 2) D/A) (7-9) 
j=1 i=1 j=1 “i=1 


式 中 “ 忆 一 一 全 部 公 因子 对 变量 x 的 总 方差 所 作 的 贡献 , 且 一 了 a5 。 


”要 求 V" 达到 最 大 ,问题 就 归结 为 求 一 个 pXp 阶 的 正 交 和 矩阵, 使 B 二 AT 能 满足 V- 
为 最 大 的 条 件 。 
对 于 fs ,fs 因子 平面 ,可 以 对 和! 作 如 下 正 交 变换 : 


coswp —sing a 
be 
sin 0 一 Cos 0 d 
1 
8 位 


Te 中 凡 没 有 标明 的 元 素 均 为 0。4 经 过 变换 后 ,相当 于 将 f; ,fs 因子 平面 旋转 一 个 角 
度 ,得 到 和 矩阵: 
B= AT, = (b,),wy 
B 中 的 元 素 分 别 为 ; 
pr 一 aigcos p+ ausin og 
| 一 一 Qizcos 的 十 Gacos 0 《&R 天 89 红 一 1 2712) 《7-10) 
bi = Ga 
如 采 有 pp 个 主因 子 , 则 必须 对 4, 中 p 列 全 部 配对 旋转 ,总 共 需 要 旋转 p(p 一 1)/2 次 ， 
全 部 旋转 完毕 算 一 个 循环 ,得 到 载荷 矩阵 : 


el 


p 
B, 一 AT 一 Ti [| TT, 一 和 Ci 


有 一 12 一 g 十 1 


得 到 Bi 后 ,可 按 式 (7-9) 计 算 Vi 。 在 第 一 个 循环 的 基础 上 ,从 B; 出 发 进行 第 二 个 旋 
转 循 环 , 旋 转 完成 后 得 到 B; , 即 : 


pl p 
B;=B,|1| I T = BC = ACC, 


8 一 19 一 8 二 1 
得 到 B 后 , 即 可 按 式 (7-9) 计 算 Vs 。 






HPTIT TT TE 
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不 断 重复 上 述 计 算 , 就 可 以 得 到 VV' 的 一 个 非 降 有 界 序列 Vi 委 V; 所 … 全 Vmex。 由 于 因 
子 载荷 的 绝对 值 不 大 于 1, 所 以 这 个 序列 是 有 上 界 的 ,必然 收敛 于 某 一 极限 VCV 的 最 大 
值 )。 因 此 ,对 于 所 要 求 的 计算 精度 es, 当 循环 次 数 上 充分 大 时 ,必然 有 : 

[Ws Vo | 

最 后 得 到 旋转 后 的 因子 载荷 矩阵 为 : 


尼 
B, -= Al Tc 二 AIC 
i=1 


2， 旋转 角度 
在 任何 一 次 旋转 变换 中 ,都 涉及 旋转 角度 的 问题 。 确 定 旋转 角度 的 步骤 如 下 : 
(1) 将 式 (7-10) 代 人 式 (7-9) 后 ,将 式 (7-9) 对 gp 求 一 阶 导数 并 令 其 为 0, 解 得 : 
tan 40 一 (D—2A.B/m)/[C— A? —Vi)/m]|= E/F (7-11) 
式 中 “有 一 一 变量 个 数 。 


令 





了 人 = (a /h;)， 万 一 2(ai /h;) (an/h,) 
则 


Al = > DH,cC= 人 Hy; D=2P TH, 


(2) 把 式 (7-9) 展 开 , 并 将 包含 的 项 合并 化 简 ,最 后 剩 下 包含 sin 4p 和 sin? 2p 的 项 
使 式 (7-9) 成 为 以 x/2 为 周期 的 函数 。 因 而 在 式 (7-11) 中 的 4p 只 需 在 一 r/4 一 r/14 之 间 考 
虑 即 可 。 同 时 ,由 式 (7-9) 对 9p 的 二 阶 导 数 应 小 于 0, 可 得 : 

下 -sin 4 0 

所 以 ,p 的 符号 可 以 根据 FE 的 符号 确定 , 它 应 与 五 同 号 。 因 此 ,可 按 互 和 开 的 正 负 号 来 
确定 4p 所 在 的 象限 。 

二 、Q 型 因子 分 析 方差 最 大 正 交 旋转 

Q 型 因子 分 析 方 差 最 大 正 交 旋转 与 R 型 因子 分 析 方 差 最 大 正 交 旋转 类 似 , 不 同 之 处 是 
Q 型 因子 分 析 的 主因 子 载荷 矩阵 4 二 C45),xp; 所 以 ,只 要 将 以 上 公式 中 的 mr 换 成 nn 即 可 。 


94 因子 得 分 
一 、R 型 因子 得 分 
主因 子 方 是 由 原始 变量 Si 线性 组 合 而 成 的 综合 变量 , 即 
f; = CLl1 十 cox 十 Ds a (J -一 1 ,2,.",p) (7-12) 


而 因子 得 分 是 把 第 i 个 样品 的 m 个 变量 的 观测 值 代入 式 (7-12) 计 算 的 函数 值 f; (j==1,2， 
“pi;1l—1,2, 71), 当 p= 二 2 时 ,根据 fis f2i (t= 1 2 ;1) 可 以 在 平面 上 对 样品 进 和 J 了 分 
类 。 
把 式 (7-12) 改 写成 矩阵 形式 ,有 : 
F=CX (7-13) 
其 中 F=(f,, fe ,fs,) ,X=(r ra Tm) 而 








重油 数学 地 需 


Cll C2l1 Cml 
C CI2 Con Cm2 


欲求 因子 得 分 ,必须 先 确定 式 (7-13) 中 的 C。 
若 因 子 载荷 矩阵 4, 为 满 秩 的 m 阶 方 阵 , 那 么 ,R 型 因子 分 析 模 型 式 (7-5) 中 的 we; 一 0， 
此 时 有 4, 一 4, 故 由 式 (7-5) 可 直接 得 了 =4-:X, 即 C= 一 4 。 通 常 4, 是 不 满 秩 的 mXp 阶 
长 方形 抢 阵 (za 加 ) ,假设 we;s0, 那 么 有 囊 汪 4 , 先 对 该 近似 式 左 乘 4, 后 ,再 左 乘 
(A141) !, 则 有 : 
F= (A A1) !'A’\X (7-14) 
由 式 (7-13) 和 式 (7-14) 得 ，; 
C= (A'A) A’, (7-15) 
一 般 说 来 ,ae; 将 随 着 所 选 因 子 数 的 减少 而 变 大 , 当 它 大 得 不 可 忽略 时 ,用 式 (7-15) 求 
出 的 系数 就 不 能 正确 计算 因子 得 分 。 在 这 种 情况 下 ,只 能 在 最 小 二 乘法 的 意义 下 对 因子 得 
分 进行 估计 。 为 此 ,必须 建立 变量 zi (一 1,2,…，,m2) 对 因子 fj 二 1,2,…, 思 ) 的 回归 方程 。 
在 因子 模型 已 标准 化 的 条 件 下 , 设 变量 xz; 对 因子 f; 的 回归 方程 为 : 
名 王国 zi 十 bz 十 入 十 Bazw (=1,2,,p) 
那么 pp 个 回归 方程 的 矩阵 形式 为 : 


A 
F = BX (7-16) 


在 式 (7-16) 中 ,pXn 阶 矩阵 下 是 矩阵 下 的 最 小 二 乘 解 ,pXm 阶 和 矩阵 B 是 回归 方程 系 
数 矩 阵 ,X 为 m Xn 阶 的 原始 数据 矩阵 。 
分 别 用 (xn 一 1)-!X 右 乘 式 (7-16) 两 边 ,得 : 
(7 一 1 FX 一 BXX’(n— 1) 一 


因为 (n 一 1)-!XX 为 变量 的 相关 矩阵 了 ,而 (n 一 1)-!FX 是 公 因 子 与 变量 的 相关 矩阵 
A1, 由 此 得 BA1R !, 把 B 代 人 式 (7-16), 得 到 R 型 因子 得 分 计算 式 ， 


A 
FE 
F=A.R':X (7-17) 
人 A A A 、/ > 
式 中 下 一 (方太 三 9 是 一 (Toy 并 ，) 
mi ri Tlm Ql U21 “Aml 
M21 ?22 Tom Ql2 G22 Un2 
R= 、 pC 
Fml Trm2 7 yom Uip U2p Wmp 


二 、Q 型 因子 得 分 
在 QQ 型 因子 分 析 模 型 式 (7-7) 中 , 当 wej 不 可 忽略 时 ,在 最 小 二 乘法 意义 下 也 可 得 到 类 


似 于 式 (7-17) 的 Q 型 因子 得 分 计算 公式 。 但 Q 型 因子 分 析 中 诸 公 因子 的 方差 收敛 很 快 , 故 
常用 式 (7-14) 计 算 因 子 得 分 。 


三 、 因 子 分 析 计 算 过 程 





好 万 多 因子 分 机 
















输入 样品 数 m1, 变量 数 m! 和 原始 数据 文件 名 


数据 预 处 理 ? Y .| 标准 差 或 极 差 标 准 化 
数据 矩阵 行列 互 换 


选择 相似 
性 度量 


计算 相关 系数 矩阵 | | 计算 相似 系数 矩阵 
计算 各 特征 值 贡献 ,选择 因子 数 


计算 各 主因 子 载荷 、 公 因子 方差 、 
主因 子 得 分 矩阵 、 方 差 最 大 旋转 


计算 方差 最 大 因子 载荷 矩阵 
及 方差 最 大 因子 得 分 官 阵 


输出 结果 


N 


换 数据 预 处 理 法 ?~ 


图 7-3 因子 分 析 流 程 图 
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95 对 应 分 析 


一 、 对 应 分 析 的 概念 

R 型 和 Q 型 因子 分 析 可 以 用 较 少 的 几 个 公 因子 去 提取 研究 对 象 的 绝 大 部 分 信息 ,化 简 
了 和 研究 系统 ,从 而 可 在 低 维 空间 中 研究 样品 的 空间 分 布 规律 和 变量 成 因 联系 ,便于 进行 地 质 
解释 和 推断 。 因 此 ,因子 分 析 在 地 质 学 中 有 着 广泛 的 应 用 ,但 是 , 它 毕竟 还 有 不 足 之 处 : 

(1) 不 能 在 同一 空间 研究 样品 和 变量 。 

R 型 和 Q 型 因子 分 析 的 研究 对 象 分 别 是 变量 和 样品 ,这 就 意味 着 把 研究 样品 空间 分 布 
规律 和 研究 变量 共生 组 合 关系 分 隔 开 来 。 事 实 上 ,样品 的 特征 要 通过 变量 来 揭示 ,如 对 一 个 
既 需 要 研究 地 质 成 因 的 空间 分 布 规 律 , 又 需要 研究 不 同类 型 样品 特征 的 地 质问 题 来 说 ,前 者 
就 要 研究 样品 ,后 者 就 要 利用 变量 来 解释 。 由 此 说 明 , 地 质 样品 和 变量 的 研究 是 不 可 分 割 
的 ,也 就 是 说 应 该 找 出 一 种 把 两 种 因子 分 析 统 一 起 来 的 研究 方法 。 

(2) 占 机 时 和 内 存 多 。 

样品 的 数量 一 般 远 比 变量 的 数目 多 ,计算 样品 相似 系数 时 不 仅 浪费 机 时 ,而 且 占 用 大 量 
的 内 存 空 间 。 

(3) 地 质数 据 的 尺度 不 同 。 

为 了 使 地 质数 据 在 同一 尺度 下 参与 地 质 分 析 ,往往 是 将 变量 进行 标准 化 处 理 ,然而 对 样 
品 就 不 好 进行 标准 化 了 。 对 变量 和 样品 的 非 对 等 标准 化 处 理 ,会 造成 地 质数 据 的 尺度 不 同 ， 
从 而 影响 对 地 质 规律 的 认识 。 

鉴于 上 述 原因 ,在 以 上 两 种 因子 分 析 的 基础 上 产生 了 对 应 分 析 。 它 采用 一 种 数据 处 理 
方法 ,把 两 种 因子 分 析 结 合 起 来 ,由 R 型 因子 分 析 结 果 直 接 导 出 Q 型 因子 分 析 结果 ,并 在 同 
一 空间 内 对 变量 和 样品 进行 分 类 ,由 此 既 可 研究 样品 的 分 布 规律 ,又 可 通过 变量 对 样品 进行 
地 质 解 释 。 

二 、 对 应 分 析 的 数据 变换 

假设 有 n 个 样品 ,每 个 样品 有 m 个 变量 ,它们 的 观测 值 为 ， 


Xl X22 ”ln 


Xm Xm ”pm 
其 中 zj 之 0(i 一 1,2,…,m;j 二 1,2,…,n), 并 且 在 每 一 行 和 每 一 列 上 至 少 有 一 个 不 为 0。 
1. 原始 数据 总 和 标准 化 
数据 矩阵 瑟 中 所 有 元 素 之 和 为 : 


P= (ps; De 
2. 样品 坐标 的 相对 比例 


用 矩阵 了 中 第 7 列 上 元 素 之 和 


撤 七 厦 网 子 分 新 





p.; = Dps (j= 1,2,*,n) 
;二 1 


去 除 P 中 第 7 列 上 的 每 个 元 素 , 得 : 
(py/pijrpa/biio pr/p) (f= 1,2,.,n) 

上 式 表 示 m 维 空间 中 的 2 个 样品 点 ,每 个 样品 点 的 坐标 是 各 个 变量 在 该 样品 中 的 相对 
比例 。 因 此 ,研究 样品 的 相似 性 就 变 为 研究 m 维 空间 中 样品 点 的 相对 位 置 。 样 品 点 间 的 距 
离 越 小 ,样品 疝 的 性 质 就 越 相 似 。 

3. 样品 点 间 的 加 权 距 离 

计算 样品 点 1 与 & 之 间 的 距离 时 ,考虑 到 指标 数量 级 的 差异 ,采用 加 权 距 高 


D(i,k) = 









> Cpa/p. — pa/pb.a) /pi 
5 


Di [pa/Cps VB) 一 加 人才 Vp )] (7-18) 
式 中 pp; 一 一 P 中 第 i 行 上 元 素 之 和 , 即 ; : 
p; 二 2 ps (1 = 1,2,. ,mm) 
它 是 第 i 个 变量 的 权 。 由 式 (7-18) 可 知 ,计算 加 权 距 离 D(C,k) 时 ,需要 把 nn 个 样品 点 的 坐 
标 改 为 : 
(pu/ (lp.; VPi. ) ;pz2j /人力 | Vp:. ) ypn/ lp.; Vpnm. ))’ (J 一 1] 2 1) 
4. 变量 坐标 的 相对 比例 
用 PP 中 第 i 行 上 的 元 素 之 和 
pi;. 二 2 ps (1 = 1,2,*",m) 
去 除了 中 第 i 行 上 的 每 个 元 素 , 得 : 
Cpi/ ps: ,pa /ps » "pal pi) (2 = ] ,2 772) 
上 式 表示 nn 维 空间 中 的 m 个 变量 点 。 
5. 变量 点 闻 的 加 权 距 离 
任意 两 点 /与 & 之 间 的 加 权 距 离 为 ; 






D' (i,k) = 





Dpo/pr 一 加 /Be )*/p., 
j=1 


Di [ps/CpeVp 1) — pu/ (pr Vp ] (7-19) 

由 式 (7-19) 可 知 , 为 了 计算 加 权 距 离 D(C,k) ,需要 把 mx 个 变量 点 的 坐标 下 为 ， 

(pa/ pivp.1), pia/ (piv p.2) 3, po/ piv pb.,)) (1 = 1]1,2,",m) 

三 、 协 方差 矩阵 

1. 变量 的 协 方差 矩阵 

(1) 变量 的 均值 。 

者 将 符 阵 已 中 的 元 素 p; 视 为 概率 ,那么 p; ,p.; 就 是 边缘 概率 。 因 此 ,m 维 空间 中 样品 
太 第 i 个 变量 的 概率 均值 为 ， 
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DV py/ (Vp p.) * pj= VP (i = 1,2,°,m) 
j=1 


(2) 变量 的 协 方差 矩阵 。 
第 i 个 与 第 ; 个 变量 的 协 方 差 为 : 


5 一 DLpa/ (Vp p.1) 一 Vp |[Lpn/ vp 2 VP [eps 
=1 
DLpa — Pi pi)/ Vp: pr dL Cp — Pp;. pe)/ vp ps | 
k=1 


[i 
ET > za 。 之 外 
k=1 


式 中 
za = (pa ©— pi pi)/ Vp p.: 


[xa/T— Cr /Te Cx/ TLC 7 TD (x. /DT 


= (za 一 Ti xa/ Tx rT) 


i = Dy za (2 = 1 ,2 ,77) 
k=l 


Kr Be > (1 一 1 ,2，… ,7) 
按 上 式 计算 ,m 个 变量 的 协 方差 矩阵 为 : 
S$ 一 ($85 ) mxm 一 ZZ 


式 中 
yA 人 (之 2 ) nxn 


2. 样品 的 协 方差 类 阵 
(1) 样品 的 均值 。 
在 4 维 空间 中 ,第 个 样品 的 概率 均值 为 ， 
Dpa/ Cp VPi) ps = Vp (k= 1,2,°,n) 


(2) 样品 的 协 方差 矩阵 。 
任意 两 个 样品 /和 的 协 方差 为 : 


= Dpa/Cp: VED — VPrILps /pe VD 一 VE p. 
= Pp 一 也 p.i)/ wy pi. pr Cps — Pi pO/ vp: p.i 


式 中 


ga = (Xa — Xi Ka/ TI xi TD 7 


按 上 式 计算 ,n 个 样品 的 协 方差 矩阵 为 : 
和 ”一 (Sh ) rxn 一 ZZ 





锯 七 递 因子 分析 





z= (ZE ) nx 

四 、 因 子 载荷 矩阵 

由 线性 代数 可 知 ,矩阵 ZZ 与 ZZ 有 相同 的 非 零 特征 值 41 之 和 宇 … 之 A (Pp 碾 m) ,并 且 对 
二 每 个 (1 志 j 志 pp) ,车 对 应 的 ww 是 ZZ 的 单位 特征 向 量 ,那么 vy 一 Zuj 是 ZZ 相应 的 单位 
特征 向 量 ; 反 之 , 若 w 是 与 Z'Z 的 特征 值 M; 对 应 的 单位 特征 向 量 ,那么 一 Zr; 则 是 ZZ 所 
相应 的 单位 特征 向 量 。 

上 述 结果 表明 , 当 求 得 变量 的 协 方差 矩阵 S 的 特征 值 MN; (1< jj 委 站 和 与 其 对 应 的 特征 
向 量 w; (==1,2,…, 轧 ) 后 , 便 可 得 到 R 型 因子 分 析 的 因子 载荷 矩阵 ,再 由 六 一 Zu 直接 求 得 
Q 型 因子 分 析 的 因子 载荷 矩阵 。 此 外 ,5 与 S$* 有 相同 的 特征 值 ,这 些 特征 值 表示 各 公 因 地 
所 提供 的 方差 。 因 此 变量 空间 中 的 p 个 因子 与 样品 空间 中 的 p 个 因子 在 总 方差 中 所 占 的 
百分比 完全 相同 , 故 用 同样 的 因子 轴 既 可 以 表示 变量 ,又 可 以 表示 样品 ,从 而 把 型 和 Q 型 
因子 分 析 统 一 起 来 。 

1. 及 型 因子 载荷 矩 阵 

若 取 5 的 前 p 个 特征 值 X;(1 志 jp) ,与 之 对 应 的 特征 向 量 为 w (j= 二 1,2,…,p) ,那么 
R 型 因子 载荷 矩阵 为 : 


Ul VAI Uil2? VA2 ”Uip MAp 
1 一 Uzl VAI Wz2 WA2 "Wp WA 


Um VA Umz WA '"* Unp VAp 
2. QQ 型 因子 载荷 给 阵 


根据 VV 一 Zn ;QQ 型 因子 载 集 和 矩 阵 为 : 
VU MAL Ve VA2 Vip WA 
V 一 Uzl VA Vz VA Vzp yf 


Unl A Yo MA? Unp VAp 
五 、 对 应 分 析 计 算 步 又 


]. 求 孔 天 阵 
把 原始 数据 矩阵 天 变换 为 忆 矩阵 ， 
Zi 一 (zx; Ts T/T Vr > (i 一 1 290 = 1],2," ,1) 
式 中 
-过 一 一 DD (1 = ls2, » 72) 
二 一 
4 Dry (7 = 二 1,2， 71) 
k=1 
T= > Ts 
ey 
2. RR 型 因子 分 析 


求 变量 协 方差 矩阵 $ 的 特征 值 2 一 1,2,…,m) , 按 ( > Ni/ > ij) 达到 的 要 求 取 前 
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个 主因 子 ,计算 因子 载荷 秆 阵 也。 
3. QQ 型 因子 分 析 
根据 b= 二 Zw; 计算 Q 型 因子 载荷 矩阵 Y。 
4. 作 图 及 地 质 解释 
在 因子 平面 内 ,以 因子 载荷 为 坐标 做 变量 和 样品 散 点 图 ,进行 地 质 解释 。 


S86 应 用 实例 


【 例 1 砂岩 分 类 。 

根据 砂岩 的 主要 碎 层 (石英 .长 石 与 岩 属 ?的 百 分 含量 对 砂岩 分 类 。 现 有 东 计 凹陷 18 块 
砂岩 样品 分 析 数 据 ( 表 7-1, 据 赵 旭 东 , 修 改 ) ,这 些 样品 均 有 人 工 鉴定 结果 ,重新 进行 对 应 分 
析 的 目的 在 于 检验 统计 分 析 方 法 的 有 效 性 。 两 个 特征 值 累计 百分比 为 100% 。 在 对 应 分 析 
平面 图 (图 7-4) 上 ,样品 分 为 四 类 ,与 人 工 鉴 定 分 类 命名 结果 完全 吻合 。 该 例 表明 ,对 应 分 
析 是 进行 分 类 和 成 因 解 释 的 一 种 有 效 方法 。 
表 7-1 岩 样 分 析 数 据 及 岩石 名 称 
石英 | 长 石 | 岩 峭 | 其 他 


含量 | 含量 | 含量 | 含量 鉴定 命名 
/% |/%|/% |/% 


同和 车 


石英 砂岩 

石英 砂岩 

石英 砂 兰 
和 硬 砂 质 石英 砂 兰 
便 砂 质 石 英 砂岩 
硬 砂 质 石 英 砂 涯 


[ei 


长 石 质 硬 砂岩 
长 石 质 硬 砂 兰 
长 石 质 硬 砂 兰 





局 fF 怕 丘 雪 中 吓人 or 





图 7-4 和 砂 大 样品 与 碎 屑 对 应 分 析 平 面 图 


【 例 23 古 潜 山 油气 藏 与 成 油 地 质 参 数 分 析 。 

对 已 探 明 的 一 些 古 潜 山 油气 藏 进行 分 类 ,研究 它们 的 资源 量 与 成 油 地 质 参 数 的 关系 ,是 
评价 未 知 古 潜 山 油气 资源 量 的 基础 。 与 其 他 类 型 的 油气 藏 一 样 , 油 源 、 供 油 、 储 集 、 轿 闭 和 保 
存 条 件 等 是 形成 证 潜 山 油 气 藏 的 基本 条 件 ,将 其 拟定 为 如 下 八 项 成 油 地 质 参 数 ， 

2 一 一 古 湾 山 到 上 四 陷 生 油 区 中 心 的 距离 ,kms 

ZX: 一 一 储 集体 的 总 筷 际 度 ,%; 

Xs 一 一 上 古 潜 山 上 和 窗 盖 层 的 厚度 ,km:; 
| km’; 
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2 一 一 生 油 兰 与 不 整合 面 的 接触 面积 ,km ; 
关闭 闭合 高 度 ,km; 

7X7 一 一 图 闭 闭合 面积 ,km; 

xs 一 一 十 潜 山 最 浅 埋 藏 深度 ,km。 

由 于 存在 同一 个 生 油 四 陷 向 不 同上 古 潜 山 图 闭 提供 油气 的 间 题 ,本 例 未 把 油 源 条 件 列 和 人 
成 油 地 质 参 数 。 对 已 探 明 的 26 个 古 洪山 油气 藏 及 其 成 油 地 质 参 数 ( 表 7-2) 进 行 对 应 分 析 ， 
计算 的 有 关 统 计 参 数 见 表 7-3、 表 7-4。 

表 7-2 古 潜 山 油气 藏 成 油 地 质 参 数 





油 藏 成 油 地 质 参 数 
序号 
1 4.0 2. 40 
2 12. 0 2. 30 
3 12.0 0. 11 
4 8.0 10. 1. 40 
5 8.0 4. 1. 70 
6 2.0 3。 2. 60 
7 3.0 3。 2. 40 
8 3.0 3. 1. 60 
9 5,.5 3. 0, 65 
10 3. 5 二 2, 50 
11 17.5 3; 2. 60 
12 6. 5 2, 3. 97 
13 2 14, y 2. 30 
]4 9.0 2. 1. 2. 80 
15 4.0 2. 4 5. 05 
16 3.0 4. 5 4. 04 
17 4.0 2. 4. 4. 50 
18 5.0 4. 6. 3. 85 
19 8. 0 5 1, 3.10 
20 .0 3. 5. 1. 95 
21 .0 1. 3.14 3. 15 
22 .0 2. 7 3. 75 
23 20. 0 1 . 4.00 
24 20.0 1. 4. 00 3, 70 
25 8. 0 5. 3. 50 
26 1.0 2.15 

















特征 值 
序号 


特征 值 
百分数 /3% 






特征 值 累积 


特 和 
-mn 百分数 /部 





一 0. 106 7 
0.308 4 
一 0.060 3 
0.1352 
0. 002 6 
0.014 6 
0. 009 8 
一 0. 028 0 


Ge 下 





OO >” DOD oO 和 一 
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表 7-4 Q 型 因子 分 析 第 1,2 公 因子 载荷 


和 
这 


二 首 
加 法 
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古 潜 山 油 气 藏 分 类 结果 见 对 应 分 析 第 1,2 公 因 子平 面 图 (图 7-5)。 两 个 公 因子 能 够 提 
取 原 始 数据 信息 量 的 81. 38%% ,并 且 第 1 个 公 因 子 占 了 57.91%, 由 此 可 见 , 它 是 形成 上 古 潜 山 


调 气 藏 的 主导 性 地 质 因 素 。 成 油 地 质 参 数 沿 fi 轴 从 左 癌 右 的 分 布 顺序 依次 为 人 5 97 969? 
之 3 9 之 8 ta sd slo 根据 成 油 地 质 参 数 的 分 布 及 其 意义 ,可 以 将 fi 因子 理解 为 油气 的 地 质 输 


导 作 用 。 根 据 成 油 地 质 参 数 沿 f; 轴 的 分 布 特征 ,可 视 fi 的 地 质 意义 为 构造 运动 和 风化 剥 





蚀 作用 。 
1 
0.30 
0o2 
| 
1 *261 
?| 
: 1! 脂 生 油 中 心 较 近 , 
: ! 上古 潜 山 不 整合 面 
0.15 1 1 与 生 油 崇 接触 面 
m4 1! 积 较 小 总 孔 阶 
距 生 油 中 心 近 、 靠 不 整 合 度 高 
面 输 导 形成 的 油气 藏 ' | 
1 | #3 
中 ” 1 
1 on Be 
“So7 半 了 5 *] 0 lie 9 > 型 
-0.32 0.16.. ~“ 0016 032 上 
:*l1_ _--- 一 -一 4315 19、 
本 1 如 
距 生 油 中 心 远 ， 古 潜 山 不 整合 re 
面 与 生 油 岩 接触 面积 小 ， 断 层 23 22 ， 
供 油 ， 总 孔隙 度 低 \、 2124,1 
De - 
-0.15 od 


图 7-5 油气 藏 与 成 油 地 质 参 数 对 应 分 析 平 面 图 
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在 对 应 分 析 平 面 图 上 ,26 个 古 潜 山 油气 藏 分 为 三 类 ， 

I 类 古 潜 山 油气 藏 距 生 油 四 陷 中 心 近 , 古 潜 山 不 整合 面 与 生 油 岩 接 触 面积 大 ,闭合 面积 
和 闭合 高 度 都 较 大 ,典型 的 特征 是 输 导 条 件 好 。 该 类 油气 藏 的 平均 探 明 储量 在 100 X10° +t 
以 上 ,个 别 油 藏 超过 500X10 +t 

[I 类 十 潜 山 油气 藏 距 生 油 四 陷 中 心 较 近 ， 三 潜 山 不 整合 面 与 生 油 宥 接触 面积 较 小 ,总 乱 
院 度 高 。 该 类 油气 藏 的 平均 探 明 储量 为 10X10' tt 

四 类 二 波山 油气 蔬 距 生 油 思 陷 中 心 远 , 古 法 山 不 整合 面 与 生 油 岩 接触 面积 小 ,车 断层 供 
油 , 总 孔 际 度 低 。 该 类 油气 藏 的 平均 探 明 储量 为 5X10"t。 

综 上 所 述 , 近 油 源 的 不 整合 面 与 生 油 崖 接触 面积 较 大 的 锐 皱 山 和 残 山 容易 形成 含油 气 
丰富 的 古 潜 山 油气 藏 。 

【 例 3] 盐 打分 类 与 成 因 。 

为 了 对 云南 某 地 盐 果 进行 分 类 和 成 因 解 释 , 对 云南 某 地 20 个 盐 泉 水 化 学 分 析 数 据 ( 表 
7-5) 进 行 对 应 分 析 。 

表 7-5 盐 泉 水 化 学 分 析 数 据 


11. 853 25.210 0. 980 
















































































2 45, 596 26.010 0. 960 
3 3, 525 11. 300 0. 850 
人 3. 681 26. 000 1.010 
5 48. 28 23. 320 0.930 
6 17, 956 37. 200 0. 980 
7 7.370 10. 690 0. 560 
8 4. 223 88. 200 0. 970 
9 6. 442 23.200 1. 080 
10 18. 234 121. 500 1. 000 
11 10, 585 135. 600 0. 980 
12 23. 535 141, 800 1]. 020 
13 .398 111. 200 1.070 
14 283. 148 215. 860 0. 980 
15 316, 604 263. 410 0.980 
16 307, 310 235,. 700 0. 990 
17 322. 515 282. 210 1. 000 
18 250. 580 410, 300 0. 930 
19 304. 092 438. 360 1.010 
20 240. 446 500. 770 0. 990 


矩阵 ZZ 的 前 两 个 特征 值 所 代表 的 方差 已 占 总 方差 的 95.94%。 因 此 , 取 前 两 个 主因 子 
就 可 很 好 地 反映 原始 数据 的 变化 。 前 两 个 主因 子 载荷 见 表 7-6。 : 

由 于 第 一 个 主因 子 亡 的 方差 占 总 方差 的 79% 以 上 ,因此 可 以 说 , 它 是 区 内 起 主导 作用 
的 一 个 因素 ,基本 上 能 够 反映 本 区 沉积 环境 演变 的 主要 特征 。 在 对 应 分 析 因 子平 面 图 (图 


7-6) 上 , 记 轴 的 左 端 为 钠 , 右 端 为 钾 , 含 钾 盐 泉 的 主要 特征 变量 10; K/Ci, 103 0 K/ > 雪 和 
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10: Mg/ClyeCNa)/el(Cl) ,10， Br/Ci 都 分 布 在 到 轴 的 右 端 ,严格 受 有 的 控制 。 在 有 因子 
载荷 中 , 占 比 重 最 大 的 变量 是 10: K/Cl, 位 于 所 轴 的 最 右 端 。 对 于 其 他 变量 , 按 其 因子 载 
荷 在 fi 中 所 占 比例 大 小 自 右 至 左 依次 为 10 开 / Sl 盐 ,10: Mg/Clye( Na)/e(CD) ,10 BC 
Na/K, 从 而 反映 出 各 种 盐 类 物质 随 着 沉积 环境 的 变化 而 开始 沉积 的 先后 次 序 。 钾 的 浓度 
自 左 至 右 递增 ,而 钠 的 浓度 变化 却 相反 。 因 此 ,可 以 把 刻 视 为 盐 类 沉积 分 异 作用 。 钠 位 于 
fi 轴 的 左 端 ,反映 了 富 钠 的 沉积 环境 。10? Br/C1,10 Mg/Cl 靠近 坐标 原点 ,说明 镁 盐 与 混 
化 物 在 本 区 钠 盐 和 钾 盐 的 沉积 过 程 中 具有 一 定 的 浓度 ,并 且 钾 盐 沉 积 过 程 中 镁 盐 的 泥人 要 
比 省 化 物 更 为 明显 。 因 子 户 提供 的 方差 要 比 fi 小 得 多 , 仅 占 总 方差 的 16. 30%。 因 子 载 
荷 较 大 的 变量 是 矿 化 度 和 Na/K ,分 别 位 于 ff 轴 的 上 .下端 , 这 两 个 变量 主要 受 户 因素 文 
配 ,而 其 他 变量 分 布 在 户 轴 的 中 部 ,在 f 上 的 因子 载荷 都 很 小 。 该 因子 表明 富 钠 环 境 的 议 


积 阶 段 ,杂质 的 混和 人 更 为 明显 。 
表 7-6 RR 型 与 Q 型 前 两 个 因子 载荷 



























1 矿 化 度 /(g L 1!) 1 
2 103 Br/C! 2 
3 103 K/ 》) 热 3 
4 103 K/C! 4 0.088 7 
Na/K 5 0.0887 
6 102 Mg/C!l 6 0. 091 6 
7 el Na) /el Cl) ， 7 0.074 6 
8 
9 -0 095 3| —0.010 0 






jt 


特征 值 累积 百分比 /% 一 0.092 1| 一 0.073 7 
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依据 上 述 分析 , 按 变量 与 样品 的 分 布 情况 ,可 把 样品 分 为 三 个 区 :工区 位 于 fi 轴 右 端 ， 
样品 特征 偏 于 含 钾 ,表明 样品 区 有 利于 形成 钾 盐 矿床 ; [区 位 于 fs 铀 左 侧 , 样 品 特征 偶 于 全 
钠 ,在 fi 轴 上 的 因子 载荷 很 相近 ,而 在 f; 轴 上 的 因子 载荷 差别 较 大 ,表明 矿 化 度 对 钠 盐 有 
较 大 的 影响 ; 取 区 位 于 上 述 两 区 之 间 ,主要 受 fi 的 影响 ,在 靠近 Na/K 的 方向 , 盐 果 有 一 年 
程度 的 钾 矿 化 ,沉积 顺序 为 过 滤 型 , 盐 泉 中 有 一 定 程度 的 钠 , 另 外 ,其 他 混 人 物质 也 相对 增 
加 。 

【 例 4 大 王 北 洼 陷 油 源 因子 分 析 。 

根据 第 四 音 [ 例 3 资料 对 大 王 北 洼 陷 油 样 和 烃 源 岩 样品 作 因 子 分 析 , 进行 油 源 对 比 。 
前 两 个 主因 子 fi ,fo 包含 了 原始 变量 的 绝 大 部 分 信息 。 从 因子 分 析 图 (图 7-7) 看 到 ;DB25-23， 
DB10-4,D371,D65-51,D65 原油 样品 和 沙 三 段 烃 源 岩 样品 集中 分 布 于 fi 右 端 ,因子 载荷 较 
大 ,在 因子 A 上 的 载荷 为 负 值 ,表明 这 些 原油 样品 和 沙 三 段 烃 源 岩 有 和 密切 成 因 联 系 。 
DX361 和 D359-2 原油 样品 与 沙 四 段 烃 源 岩 样品 分 布 于 fi 右 端的 上 下 侧 , 因 子 载荷 较 高 ， 
表明 这 两 个 原油 样品 与 沙 四 段 烃 源 岩 具有 明显 的 成 因 联 系 。D359-1 原油 样品 和 沙 一 段 烃 
源 岩 样品 在 fi 和 f, 上 的 因子 载荷 相差 不 大 ,表明 他 们 之 间 有 密切 的 成 因 联 系 。 在 一 定 范 
围 内 ,样品 户 载荷 的 大 小 与 样品 的 成 熟 度 参数 具有 人 负 相 关 性 ,当成 熟 度 达到 某 个 临界 值 时 ， 
样品 在 (成熟 度 ) 上 的 载荷 趋 于 稳定 。 因 此 ,根据 D359-1, D35-5-4, D35-11-xo, D355， 
DB14-18 原油 样品 的 分 布 趋势 ,上 述 原 油 样品 应 与 Es! 烃 源 岩 有 成 因 联系 ,但 也 可 能 是 多 源 
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图 7-6 盐 泉 与 水 化 学 对 应 分 析 图 
混合 成 因 。 
其 余 原 油 样 品 和 各 层 段 烃 源 岩 都 没有 密切 的 相关 性 ,但 均 分 布 于 各 烃 源 岩 的 过 渡 带 上 ， 
可 能 表明 他 们 是 多 源 混合 成 因 的 。 所 有 样品 在 户 上 和 载荷 较 大 ,载荷 的 大 小 与 样品 的 成 熟 席 
参数 具有 人 负 相 关 关 系 ,因子 户 在 某 种 意义 上 反映 了 沉积 环境 的 差异 。 
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思考 与 练习 


， 什么 是 因子 分 析 ? 它 的 主要 功能 是 什么 ? 

. 何谓 及 型 和 QQ 型 因子 分 析 , 它 们 的 研究 对 象 是 什么 ? 
.因子 分 析 可 用 来 研究 地 学 中 哪些 方面 的 问题 ? 

. 及 型 和 Q 型 因子 分 析 有 何不 同 ? 

.、 热 各 因 子 分 析 模 型 ,并 理解 模型 的 意义 。 

. 如何 求 因 子 分 析 中 的 主因 于 解 ? 

.在 因子 分 析 中 ,为 何 要 进行 方差 最 大 正 交 旋转 ? 

. 什么 是 因子 得 分 ? 如 何 计算 因子 得 分 ? 

. 试 述 因子 分 析 的 计算 步骤 ,如 何 应 用 得 到 的 各 种 结果 ? 
10. 


什么 是 对 应 分 析 ? 在 对 应 分 析 图 上 可 以 获得 哪些 信息 ? 
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第 八 章 ” 聚 特 卡 罗 法 
S1 蒙特 卡 罗 法 概述 


一 、 蒙 特 卡 罗 法 的 基本 思想 

蒙特 卡 罗 法 又 叫做 统计 试验 法 。 它 是 针对 数值 解 不 确定 的 一 类 问题 , 求 其 在 茶 条 件 下 
的 概率 解 的 一 种 统计 学 方法 。 其 基本 思想 可 概括 为 :欲求 某 问 题 的 概率 解 ,就 构造 一 个 表征 
该 问题 概率 解 的 数学 模型 , 记 为 

Y = p(X, Xs, X,) (8-1) 

使 问题 的 概率 解 是 式 (8-1) 的 某 个 数字 特征 (如 数学 期 望 . 方 差 等 ) ,并 且 这 个 数字 特征 又 能 
够 用 统计 的 方法 求 得 其 估计 值 ,那么 就 把 该 估计 值 作 为 该 问题 概率 解 的 近似 值 。 

二 、 求 解 的 基本 过 程 

由 蒙特 卡 罗 法 的 基本 思想 可 以 得 出 ,求解 过 程 大 致 可 归纳 为 四 步 : 

(1) 分 析 数 值 解 不 确定 问题 所 依赖 的 随机 变量 ,构造 表征 数值 解 不 确定 问题 概率 解 的 
数学 模型 。 

(2) 对 概率 解数 学 模型 式 (8-1) 中 的 随机 变量 Xi ,Xs ，… ,XX, 进 行 m 次 随机 抽样 ,获得 
随机 变量 的 m 组 抽样 值 ， 


Ik 9 Ta2k yi (k= 1 ,2,°* ,7) (8-2) 
(3) 分 别 把 式 (8-2) 中 的 m 组 抽样 值 代入 式 (8-1), 求 Re. 
出 随机 变量 了 的 m 个 估计 值 y1 ,ys，…，,ym。 1 


(4) 根据 y ,ys，… ,ya ,用 频率 统计 法 求 出 Y 的 分 布 曲 
线 (图 8-1) ,由 此 可 以 获得 概率 不 小 于 p; 所 对 应 的 解 y。。 

三 、 方 法 中 的 核心 问题 

由 求解 过 程 可 知 ,利用 蒙特 卡 罗 法 求 数值 解 不 确定 问 外 
题 概率 解 的 核心 是 对 随机 变量 进行 随机 抽样 , 获得 其 抽样 
值 。 但 是 ,对 于 数学 .物理 .工程 技术 .地 质 学 等 问题 中 的 随 
机 变量 往往 不 可 能 进行 m 次 随机 抽样 ,解决 该 问题 的 方法 是 先 用 数学 的 方法 在 计算 机 上 产 
生 数 以 千 计 .万 计 , 其 至 是 百 万 计 的 在 [0,1] 区 间 上 均匀 分 布 的 随机 数 ,然后 利用 这 些 随机 数 
来 实现 对 不 同 分 布 的 随机 变量 进行 随机 抽样 。 

综 上 所 述 ,蒙特 卡 罗 法 是 以 概率 论 与 数理 统计 理论 为 指导 ,有 着 广泛 应 用 领域 的 通用 性 
统计 学 方法 。20 世纪 40 年 代 , 在 计算 机 上 对 中 子 的 行为 进行 随机 抽样 模拟 ,推断 所 要 求 的 
参数 。1946 年 ,物理 学 家 汉 。 诺 依 曼 (John von Neumann) 用 随机 抽样 的 方法 模拟 了 中 子 连 
锁 反 应 。 当 时 出 于 保密 ,将 这 种 统计 学 方法 以 赌 城 蒙 特 卡 罗 的 名 字 命 名 为 蒙特 卡 罗 法 。 

油气 资源 评价 属于 数值 解 不 确定 的 问题 ,20 世纪 60 年 代 开始 把 蒙特 卡 罗 法 用 于 油气 
资源 的 定量 估算 。 美 国 1975 年 完成 的 第 二 次 全 美 石油 资源 评价 的 主要 算法 就 是 蒙特 卡 罗 
法 。 目 前 世界 上 各 主要 产 油 国 及 西方 各 大 石油 公司 都 把 这 种 方法 作为 石油 资源 定量 评价 的 


图 8-1 分 布 曲线 与 概率 解 示 意图 
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重要 方法 之 一 ,广泛 应 用 于 含油 气 区 的 早 . 中 期 勤 探 阶段 。 我 国 应 用 该 方法 估算 石油 资源 量 
始 于 1975 年 ,是 第 二 次 全 国 油气 资源 评价 的 主要 算法 之 一 ,现在 国内 各 石油 公司 已 普 凯 使 
用 ,并 已 成 为 以 统计 预测 为 主 的 应 用 软件 评价 系统 的 核心 算法 。 


82 随机 数 的 产生 和 检验 


随机 数 是 随机 变量 的 观测 值 ,由 其 构成 的 数据 友 列 叫做 随机 数 序 列 , 它 是 一 个 无 周期 的 
数据 序列 。 如 前 所 述 ,要 对 数值 解 不 确定 问题 中 的 随机 变量 进行 随机 抽样 , 则 需要 先 用 数学 
的 方法 在 计算 机 上 产生 数 以 千 计 .万 计 , 其 至 是 百 万 计 的 在 [0,1j] 区 间 上 均匀 分 布 的 随机 数 ， 
这 种 随机 数 构 成 一 个 周期 性 的 数据 序列 。 为 此 , 称 这 种 周期 性 数据 序列 为 “ 伪 随 机 数 ” 序 列 ， 
其 中 的 元 素 叫 做 “ 伪 随 机 数 ”。 在 伪 随 机 数 制约 下 所 获得 的 随机 变量 的 抽样 值 序列 显 然 不 是 
一 个 随机 序列 ,也 就 是 说 ,这 种 抽样 值 并 非 是 随机 变量 的 真实 观测 值 。 尽 管 如 此 ,只 要 对 伪 
随机 数 序 列 进行 一 系列 严格 的 统计 检验 ,证 明 它 可 以 满足 模拟 计算 的 精度 要 求 , 则 伪 随 机 数 
就 可 以 作为 真 随机 数 使 用 。 

为 了 满足 模拟 问题 的 需要 ， 在 计算 机 上 产生 的 伪 随 机 数 序列 不 仅 要 有 足够 长 的 周期 ， 而 

应 当 具 有 符合 要 求 的 概率 统计 性 质 。 

OC 
的 随机 数 。[0,1j] 区 间 上 均匀 分 布 的 随机 变量 的 抽样 值 是 最 简单 .最 基本 的 一 种 连续 分 布 的 
随机 数 , 其 他 分 布 的 随机 数 都 可 以 借助 它 来 产生 ,所 以 说 均匀 分 布 随机 数 是 实现 随机 抽样 的 
基本 工具 。 

一 、 随 机 数 的 产生 方法 

在 计算 机 上 产生 擅 随 机 数 的 数学 方法 有 和 迭代 取 中 法 、 移 位 法 和 同 余 法 等 。 前 两 种 方法 
所 产生 的 伪 随 机 数 序 列 的 周期 对 初始 值 的 依赖 性 很 大 , 选 得 不 好 时 , 伪 随 机 数 序列 的 长 度 较 
短 ,不 能 满足 模拟 计算 的 需要 。 目 前 产生 伪 随 机 数 序列 比较 好 的 方法 是 同 余 法 中 的 乘 同 余 
法 和 混合 同 余 法 。 

该 方法 产生 伪 随 机 数 序 列 的 递 推 同 余 公式 为 : 

ZaH 三 az， (mod M) 

7 + 一 xT/ M We 
式 中 了 ozon+i 分 别 是 第 n 次 和 第 十 1 次 产生 的 伪 随 机 数 ; 
滋 子 系数 ; 
M 一 一 模 ; 
Lo,1] 区 间 上 的 第 ”十 1 个 伪 随 机 数 。 

Xs+t1 二 gxn(mod M) 叫 做 以 M 为 模 的 同 余 式 ,其 含义 为 z+ 是 a 与 x, 的 乘积 除 以 M 的 
余数 部 分 。 

乘 同 余 法 由 Lehmer 提出 ,他 曾 取 M==100 000 001,a 二 23, 初 值 xo 二 47 594 118, 得 到 
周期 为 5 882 352 的 8 位 十 进 制 伪 随 机 数 序列 ,并 对 其 中 的 5 000 个 伪 随 机 数 进行 统计 检 
验 , 其 结果 认为 是 满意 的 。 

乘 同 余 法 所 产生 的 伪 随 机 数 序列 的 周期 与 初 值 x 、 乘 子 系数 有 密切 的 关系 。 因 此 ， 

用 乘 同 余 法 产生 伪 随 机 数 时 ,设计 算 机 字 长 为 &,M=2, 取 z 与 M 互 素 , 当 wo 与 M 符合 一 
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定 条 件 时 , 乘 同 余 法 产生 的 伪 随 机 数 序列 最 大 可 能 周期 为 2-:。 一 般 取 初 值 一 2c 十 1 型 
的 数 ,a 二 8g 土 3, 其 中 g 为 正 整 数 。 最 好 取 a 二 521! ,其 中 是 使 5%+1 < 一 24 成 立 的 最 大 正 整 
数 ， : 

2. 混合 同 余 法 

混合 同 余 法 产生 伪 随 机 数 序列 的 递 推 同 余 式 为 

wi dp (mod M) 
i MM 

混合 同 余 法 与 乘 同 余 法 的 差别 仅 是 增加 了 一 个 增 量 8, 其 他 含义 与 式 (8-3) 相 同 。 

混合 同 余 法 所 产生 的 伪 随 机 数 序列 的 周期 及 统计 性 质 与 zo。,a,B,M 的 取 值 有 着 密切 的 
联系 。 若 取 值 不 当 , 产 生 的 伪 随 机 数 序列 的 周期 可 能 很 短 ,或 者 是 非 随机 性 的 数据 序列 。 一 
个 混合 同 余 伪 随 机 数 序列 ,达到 周期 为 M 的 充分 必要 条 件 是 : 

中 8 与 M 互 素 ; 

@ 对 每 一 个 M 的 素 因 子 p ,a 一 1 为 p 的 倍数 ; 

@ 车 M 是 4 的 倍数 ,那么 a 一 1 为 4 的 倍数 ; 

车 计算 机 字 长 为 , 当 M 二 2: 时 ,应 取 a=4g 十 1,8 二 2a 十 1,zo 为 任意 的 非 负 整数 ,其 中 
d 为 正 整数 。 

当 M 一 2 一 524 288 ,a 二 5 二 3 125 时 ,zo 二 23,11,19,37; B=3,7,11,17 分 4 套 配 合 使 
用 ,混合 同 余 法 产生 周期 为 524 288 的 伪 随 机 数 序列 。 

二 、 伪 随机 数 序列 的 统计 检验 

前 已 述 及 ,即便 是 产生 伪 随 机 数 比 较 好 的 同 余 法 ,也 不 能 在 计算 机 上 产生 [0,1] 区 间 上 
均匀 分 布 的 真 随机 数 序 列 ,只 能 是 在 参数 选取 恰当 的 条 件 下 产生 统计 性 质 符合 要 求 .周期 长 
度 足 够 大 的 伪 随 机 数 序列 。 这 就 是 说 ,对 于 选 定 参数 下 所 产生 的 一 个 伪 随 机 数 序列 ,只 有 通 
过 严格 的 统计 检验 后 ,才能 确定 它 是 否 可 做 [0,1] 区 间 上 均匀 分 布 的 随机 数 序列 使 用 。 一 般 
来 说 , 伪 随 机 数 序列 的 均匀 性 和 独立 性 (随机 性 ) 是 需要 进行 统计 检验 的 主要 性 质 。 当 然 ,在 
解决 不 同类 型 的 实际 问题 时 ,对 各 种 统计 性 质 的 要 求 不 同 ,就 要 根据 要 求 进行 不 同 的 检验 。 
这 里 仅 介绍 检验 伪 随 机 数 序 列 均匀 性 和 独立 性 的 几 种 方法 。 


(8-4) 


1. 均匀 性 检验 
均匀 性 检验 包括 矩 检 验 .频率 检验 和 累积 频率 检验 。 
(1) 和 矩 检验 。 


和 矩 检验 也 称 参数 检验 。 它 是 对 伪 随 机 数 序列 各 阶 矩 统计 量 的 一 种 显著 性 检验 。 若 伪 随 
机 数 序列 的 长 度 (序列 内 伪 随 机 数 的 个 数 ) 为 ”那么 它 的 各 阶 矩 为 ， : 


mm; 一 1 > 
式 中 m4 一 一 伪 随 机 数 序 列 的 & 阶 算 ， 


[10,1j] 区 间 上 分 布 的 第 i 个 伪 随 机 数 的 & 次 方 。 
二 阶 中心 矩 (方差 ) 为 : 





rt 


1 Ei 
$ 一 一 > (Cr 一 11) -一 77， 一 771 
1 一] 


在 理论 上 ,标准 均匀 分 布 的 & 阶 矩 we 和 总 体 的 方差 o? 分别 为 : 
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pe = 1/(k+1); oo= py— p= 1/12 
假设 生成 的 为 伪 随 机 数 符合 标准 均匀 分 布 ,那么 mass 应 与 jy0 一 致 。 
若 以 疡 个 伪 随 机 数 为 一 组 , 共 算 出 立 组 一 阶 矩 mi、 二 阶 矩 mm 二 阶 中 心 矩 5 ,它们 的 
平均 值 为 


根据 中 心 极限 定理 , 当 woo 时 ,mi ,ms: 的 分 布 趋 于 标准 正 态 分 布 , 其 平均 值 分 别 趋 
于 1/2,1/3,1/12, 而 总 体 方 差分 别 趋 于 1/ (2h) ,4/(45h),1/(180h)。 因 而 可 建立 统计 量 : 


二 和 一 《7 。 一 -和 一 《52 一 
和 一 (向 一 1/2)/ Ta m= Cm — 1/3/ me’ ws = ( 尝 一 1/12)/A/ 5 


ui ,uz ,us 近似 服从 正 态 分 布 , 并 且 可 以 确定 均匀 性 假设 的 临界 域 R, 即 


1 1 1 1 
ee 
I (3 WaTI2ho’ 2 Tu | 
1 4 1 4 
RR; | » 一 
? GS Ve Af 45hu” 3 | 
1 1 ] 1 
Rp i | 
村 uA/ TIBORo’ 12 tw | 


当 ma ,mmz ，s* 大 于 对 应 的 RR 的 上 界 或 小 于 R 的 下 界 时 ,应 否认 均匀 性 假设 。u 可 以 从 
正 态 分 布 的 双 侧 分 位 数 表 中 查 得 。 

(2) 频率 检验 。 

这 种 检验 又 称 拟 合 优 度 检验 。 如 果 把 [0,1j] 区 间 分 成 (一 般 取 ==8,16,32) 个 等 子 区 
间 ,那么 频率 检验 即 是 检验 每 个 子 区 间 的 观测 频数 n; 与 理论 频数 mm, (m;= 王 zk) 之 间 的 差 
异 。 为 此 ,可 建立 自由 度 为 一 1 的 x? 分 布 检验 统计 量 : 











Y 二 pO — n/k)’ 

式 中 2 一 一 被 检验 的 伪 随 机 数 个 数 ， 

假设 HH, :观测 频数 与 理论 频数 差异 不 显著 。 

给 出 检验 水 平 a 一 0.05, 若 x 之 x3.0s , 则 否定 假设 日 ,, 即 n; 与 m; 差异 显著 ( 伪 随 机 数 
序列 分 布 不 均匀 ) ,反之 接受 假设 日 ,, 即 伪 随 机 数 序 列 分 布 均匀 ，。 

(3) 累积 频率 检验 。 

该 检验 也 称 柯 尔 莫 果 罗 夫 拟 合 优 度 检 验 。 设 Fr) 是 伪 随 机 数 序列 的 分 布 函数 ,而 
Sa(7) 是 对 该 序列 进行 n 次 独立 观测 得 到 的 经 验 分 布 函数 。 根 据 柯 尔 莫 果 罗 夫 -斯 米尔 诺 夫 
定理 ,对 于 任意 4 汪 >0, 有 等 式 ; 


limQ, (%) = limp(D, < a/ Vn) = QO) 





十 co 
式 中 也 ,= sup | Fr) 一 9$,(r) | ,QQ) = (一 1 ) ee 
or 人 el 


点 二 一 


因此 , 当 试 验 次 数 足够 大 时 ,就 可 以 认为 D,<A/Vn 的 概率 pCD, 二 A/Yn0) 趋 于 QO)。 
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pnD, 宇 %0) = 1— QMN) 一 wa 

很 小 时 ;就 发 生 了 小 概率 事件 ,由 此 即 可 检验 伪 随 机 数 序 列 的 均匀 性 。 当 入 之 0.05 时 , 则 可 
认为 伪 随 机 数 序列 的 不 均匀 性 是 显著 的 ,否则 认为 产生 的 是 均匀 分 布 的 伪 随 机 数 序列 。 

2. 独立 性 检验 

它 是 对 伪 随 机 数 的 自 相关 性 进行 的 统计 检验 。 检 验方 法 有 很 多 种 ,在 此 仅 介 绍 简 单 的 
独立 性 检验 和 顺序 检验 。 

(1) 简单 独立 性 检验 。 

简单 独立 性 检验 又 称 无 重复 列 联检 验 。 进 行 这 种 检验 ,首先 是 把 被 检验 的 伪 随 机 数 序 
列 等 分 成 u 与 v 两 部 分 ,并 且 要 求 任 一 个 伪 随 机 数 只 能 唯一 地 属于 xz 或。 

设 u,v 两 部 分 的 值 分 别 为 wu (一 1,2,…) ,把 单位 正方 形 划 分 为 直行 疡 列 的 网 格 , 并 
把 点 (u,v,) 落 在 网 格 (i,j) 内 的 观测 频数 记 为 n; 。 若 u,v 相互 独立 ,那么 u,v 同时 出 现 的 
概率 为 : 

访 (z yi) = plu,) plv,) (8-5) 

0 5) 为 假设 理 , ,比较 观测 频数 ni 与 理论 频数 m; 之 间 的 差 

异 是 否 显 著 的 一 种 检验 。 


ni; 一 en nj; 一 > 大 一 > ns 
J 三 1 i 二 1] i 





构造 检验 统计 量 
2 2 (72 一 212 7) yy， ny 
0 [AA | =1 j=1 iy nN 
因为 
Pu) A ns /n, pw) > n.j/n, 
所 以 
m; = np(u,v) A nn.;/n 
又 因 
大 h 
We (i = 1,2,.,k) 
J 3 
nj = Yns > i (7 一 2， 天) 
1=1 7 一 上 


所 以 x 的 自由 庆 为 : 
hg 一 (中 十 下 一 二 一 (一 1 一 十) 

假设 互 ,: 记 (za 一 户 (2) 记 (ww ) 。 

对 于 检验 水 平 a 二 0.05 ,如 果 x 过 xi.0s ; 则 可 认为 u,v 是 相互 独立 的 ; 若 x¥ 之 xi.os， 则 称 
u,v 之 间 相 关 显 著 ; 硅 汪 之 Xi.w; 则 称 u,v 之 间 相 关 极 显著 。 

(2) 顺序 检验 。 

顺序 检验 又 称 有 重复 列 联检 验 。 对 于 随机 性 的 伪 随 机 数 序列 ,不 会 出 现在 某 一 类 型 的 
伪 随 机 数 之 后 总 是 出 现 另 一 类 型 伪 随 机 数 的 现象 。 把 单位 正方 形 划 分 为 & 行 疡 列 的 网 格 ， 
如 果 把 盆 随 机 数 序列 中 相应 的 两 个 伪 随 机 数组 成 一 个 点 ,那么 被 检验 的 n 个 伪 随 机 数 构成 


的 2 个 点 落 入 所 有 网 格 内 的 频数 应 近似 相等， 并 且 1 二 nn;。 奉 mi 是 观测 频数 nj; 的 理论 频 
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数 , 则 有 统计 量 


妇 一 各 一 部 


式 中 it 一 之 (了 一 m)*/msm 二 n/h ,自由 度 为 hh 一 1; 


二 3 DWCn 一 m)*/mym 二 n/ 有 评 ,自由 度 为 hk 一 1。 


为 了 计算 站, 党 ,需要 把 1 个 伪 随机 数 按 大 小 分 为 N 种 类 型 , 即 
(I— 1)/N<r 人 Ii/N (j= 1,2,.",N) 
(k—1)/N<<ran < 一 RN (k= 1,2,.,N) 
分 类 后 便 可 计算 避 , 民 以 及 y?。 对 于 给 定 的 检验 水 平 二 0.05, 若 光 全 Xos, 则 称 伪 随机 数 
序列 显著 顺序 相关 ,否则 认为 伪 随 机 数 序列 顺序 不 相关 。 
S 3 随机 变量 的 抽样 
在 [0,1] 区 间 上 均匀 分 布 随机 数 的 基础 上 ,就 可 以 实现 对 随机 变量 的 随机 抽样 了 。 对 随 
机 变量 的 抽样 有 多 种 方法 ,在 此 介绍 经 验 分 布 函数 抽样 法 .直接 抽样 法 和 变换 抽样 法 。 
一 、 经 验 分 布 函数 抽样 法 
1， 随机 变量 的 经 验 分 布 函 数 
按 数 学 中 的 定义 ,随机 变量 X 的 分 布 函数 是 X 的 取 值 不 大 于 某 实数 xz 的 概率 p(X 专 
Xx) ,通常 将 其 记 为 : 
F(x) = p(X <x) 
随机 变量 X 的 经 验 分 布 函数 是 由 X 的 n 次 观测 值 x;(i 二 1,2,…,n) 用 频率 统计 法 求 出 
的 分 布 函数 ,并 将 其 记 为 : 
F(X) = p(A x) 
在 油气 资源 评价 及 其 他 地 质 研究 工作 中 ,人 们 常常 需要 知道 随机 变量 X 的 取 值 大 于 某 
实数 z 的 概率 p(X 二 x) ,显然 
P(X>7x)=1— p(X 7) 


记 ; 
F(x) = p(X>7z)=1— p(XAIr)=1— F,(7r) {8-6) 
式 (8-6) 是 油气 资源 评价 及 其 他 地 质 研 究 中 常用 的 随 人 
机 变量 的 经 验 分 布 函数 (图 8-2)， 1 
2， 经 验 分 布 函数 的 构造 方法 
(1) 频率 统计 法 。 05 
假设 已 有 随机 变量 X 的 2(* 亿 30) 个 观测 值 x;(i=1， 
2,…,n) ,那么 用 频率 统计 法 求 经 验 分 布 函数 式 (8-6) 的 大 Xmin z x 
致 步骤 如 下 : 


图 8-2 经 验 分 布 函数 示意 图 
中 确定 频率 统计 区 间 数 。 


设 观测 值 的 个 数 为 n, 区 间 数 为 mlm 为 奇数 ) ,并 按照 n/m 宇 5 的 原则 确定 m 的 值 。 
@ 计算 区 间 间 隔 值 。 
rz 十 1 个 区 间 间 隔 值 为 ; 






利 门 站 尹 特 卡 吕 污 





Zi = Tx tT [xmax — Tmin) /mj (一 1 (i = 1,2,… Mm 十 1) 
式 中 zwox ;Xmin 一 一 分 别 为 随机 变量 观测 值 的 最 大 值 和 最 小 值 。 
@ 求 经 验 分 布 函数 。 
记 nn 为 观测 值 落 人 区 间 (x; ,zit1) 内 的 频数 ,fi 为 累加 频率 , 则 


1 ~ | 
| 1 0 
入 > nn (2 mm) 


7 一 


而 经 验 分 布 函数 为 : 
1 ， XI 寺 工 之 Tz13 
fz， Xr TT 
F(x) = 
fm oe ee 


Qs Sy 


(2) 等 概率 统计 法 。 
当 随 机 变量 的 观测 值 为 10 一 30 个 ,而 且 又 不 知道 随机 变量 的 分 布 概率 模型 时 ,如 果 和 采 
用 频率 统计 法 求 随 机 变量 的 经 验 分 布 函数 ,就 会 因 统 计 区 间 个 数 少 而 使 得 经 验 分 布 函数 过 
于 粗糙 。 此 时 ,可 视 随 机 变量 观测 值 出 现 的 概率 是 相等 的 。 如 果 样 本 容量 为 a, 把 观测 值 按 
大 小 顺序 排列 成 ， 
XE 
若 < 4+1 ; 则 不 大 于 t 的 观测 值 的 频率 为 k/n, 那 么 经 验 分 布 函数 为 ， 
F',(x) = 1— F,(x) 


式 中 
0 工 达 Xl 
F, (x) = 全 ， 上 过 工 世 Tl 
J i 


3. 经 验 分 布 函 数 的 抽样 

经 验 分 布 消 数 图 (图 8-3) 的 坐标 原点 为 (xmn ;0)，, 以 
随机 变量 观测 值 的 最 小 值 zi 与 第 i 个 伪 随 机 数 7; 组 成 ”入 
数据 对 ,在 分 布 函数 图 的 织 轴 上 确定 一 个 人 口 点 (zn, 
;;) ,过 该 点 作 横 轴 的 平行 线 交 分 布 曲线 于 点 (ziyr)， 交 
点 的 横 坐 标 x; 对 应 于 伪 随 机 数 x; 对 随机 变量 的 一 次 随 xm i 出口 信 ) x* 
机 抽样 值 。 在 经 验 分 布 函数 抽样 中 , 常 称 ~ 为 随机 抽样 
的 随机 人 口 值 或 概率 人 口 值 , 而 称 z; 为 随机 抽样 的 出 口 
值 。 用 上 述 方法 可 以 得 到 随机 变量 的 一 系列 随机 抽样 值 。 实 际 计算 时 ,是 用 插值 (线性 或 
非 线性 插值 ) 的 方法 求 出 伪 随机 数 ~ 对 随机 变量 的 随机 抽样 值 z;。 

二 、 直 接 抽 样 法 






(zz 三) 


图 8-3 分 布 函数 抽样 示意 图 


直接 抽样 法 是 对 具有 单调 递增 的 连续 分 布 函数 ,并 且 又 可 用 区 间 [L0,1j 上 均匀 分 布 的 随 





a 
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机 变量 的 显 式 表示 的 随机 变量 » 的 随机 抽样 。 

在 区 间 [0,1] 上 均匀 分 布 的 随机 变量 与 其 他 分 布 的 随机 变量 在 理论 上 有 以 下 重要 关系 ， 

假设 随机 变量 w 具有 单调 递增 的 连续 分 布 函数 (zx) (或 已 给 出 分 布 密度 因数 f(x))， 
则 随机 变量 [二 Fly) 是 区 间 [0,1j 上 均匀 分 布 的 随机 变量 。 换 名 话说 ,如 果 8 为 区 间 [0,1] 
上 均匀 分 布 的 随机 变量 ,而 F(x) 是 某 个 随机 变量 的 分 布 函 数 ,并 且 F(x) 为 单调 递增 的 连续 
函数 ,那么 wy 一 F-'( 引 是 以 F(z) 为 分 布 函 数 的 随机 变量 。 

由 上 述 关系 可 知 , 只 要 随机 变量 具有 连续 单调 递增 的 分 布 图 数 ,F (x) 又 能 够 用 显 式 
表示 出 来 ,就 可 以 用 均匀 分 布 的 随机 抽样 序列 产生 其 他 分 布 的 随机 抽样 序列 。 但 一 般 说 来 ， 
n 不 能 用 的 显 式 写 出 来 ,内 此 ,随机 变量 的 直接 抽样 法 仅 适 合 对 某 些 分 布 概率 模型 的 随机 
变量 抽样 。 下 面 是 用 这 种 抽样 方法 抽样 的 例子 。 

K 例 13 试 由 区 间 [0,1] 上 均匀 分 布 的 随机 变量 5 产生 [La,o] 区 间 上 均匀 分 布 的 随机 变量 


Yo 
解 :La,bj 区 间 上 均匀 分 布 的 随机 变量 7 的 密度 函数 为 : 
ee 1/(6— a) (a 达 工 忒 如) 
人 | 0 (其 他 ) 
根据 随机 变量 间 的 理论 关系 ,有 : 
l= | [Ge — a)Jdx = (Xn— 4)(b—a) 
由 此 得 : 


1 一 《一 a)5 十 < 
〖【 例 2] 试 由 L0,1j 区 间 上 均匀 分 布 的 随机 变量 ?产生 服从 三 角 分 布 的 随机 变量 7。 
解 : 当 随机 变量 的 密度 函数 为 fz) 三 2z(0 委 z 魏 1) 时 , 称 之 为 三 角 分 布 。 根 据 随机 变 
量 间 的 理论 关系 ,有 : 


= | 2zdz = 
由 此 得 : 
n= C7 
结果 表明 ,L0,1j 区 间 上 均匀 分 布 的 随机 变量 的 平方 根 服从 三 角 分 布 。 
【 例 33 设 5 是 L0,1] 上 均匀 分 布 的 随机 变量 ,7 是 服从 指数 分 布 的 随机 变量 ,其 分 布 函数 
为 : 
F(T (xX 放 0,4 为 常数 ) 
试用 5 把 ?7 表示 出 来 。 
解 :由 随机 变量 间 的 理论 关系 可 得 : 
“一 1 一 e 7 
所 以 
a lIn(1— /A 
因 & 在 L0,1j 上 是 均匀 分 布 ,而 1 一 8 在 L0,1] 上 也 是 均匀 分 布 , 故 有 : 
7 一 一 (In 0) /A 
【 例 43 试 证 标准 正 态 分 布 的 随机 变量 7 的 抽样 序列 不 能 用 [0,1] 上 均匀 分 布 的 随机 变 
量 5 的 抽样 序列 表示 出 来 。 
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解 :根据 随机 变量 的 理论 关系 ,由 标准 正 态 分 布 的 密度 函数 : 








WE 
(二 一 e 2 
f(x 二 
虽然 可 得 : 
i 
y= ; | dz 


但 是 ,7 却 不 能 用 的 显 函 数 形式 表示 出 来 ,因此 ,无 法 由 [0,1] 上 均匀 分 布 的 随机 变量 5 的 
抽样 序列 产生 标准 正 态 分 布 随 机 变量 的 抽样 序列 。 
三 、 变 换 抽样 法 
变换 抽样 法 是 对 具有 单调 递增 的 连续 分 布 函 数 , 但 却 不 能 用 [o ,1 区间 上 均匀 分 布 的 随 
机 变量 5 的 显 式 表示 的 随机 变量 7 的 随机 抽样 。 
正 态 分 布 是 常用 的 一 类 分 布 , 它 的 抽样 方法 是 统计 试验 法 的 重要 内 容 。 产 生 服 从 
N(0,1) 的 抽样 值 ,又 是 获得 服从 Ne,o) 的 抽样 值 7 的 基础 。 
假设 x; ,zi 是 相互 独立 的 在 L0,1] 上 均 久 分 布 的 两 个 随机 数 ,做 如 下 变换 : 
xz = (一 2ln zi) cos 27ZH1 
0 = (一 21in x,)! sin 2xxi 
那么 ,5, 5 就 是 两 个 相互 独立 的 服从 N(0,1) 分 布 的 随机 数 。 
设 zyzz，…z 是 ?2 个 相互 独立 的 L0,1j 上 均匀 分 布 的 随机 数 ,那么 x; 的 期 望 和 方差 
为 : 
E(r) SS 12: D(zx;) = 1/12 
根据 中 心 极限 定理 , 当 n 充分 大 时 ， 


b= (rn/2)/ Vn 
的 分 布 渐 近 于 N(0,1) 分 布 , 故 可 把 & 近似 看 做 服从 标准 正 态 分 布 的 随机 数 。 通 常 取 n 等 
于 8 或 者 12, 当 ”一 12 时 变换 最 方便 。 
如 果 随 机 变量 ” 的 数学 期 望 为 E(w) ,方差 为 DC7) 盖 0, 那 么 随机 变量 
2 一 [7— EC(n) |/v DC) 
服从 NC0,1) 分 布 ,因此 有 : 
7= VD + G+ En) 
上 起 表明 ,在 已 知 随机 变量 7 的 数学 期 望 和 方差 的 条 件 下 ,可 由 服从 N (0,1) 分 布 的 随 
机 变量 直接 产生 随机 变量 wy 的 随机 数 。 


S 4 蒙特 卡 罗 法 估算 油气 资源 量 
一 、 油 气 资源 量 概率 模型 
局 部 含油 气 地 质 单元 是 估算 油气 资源 量 的 基本 地 质 体 。 在 估算 资源 量 时 , 它 的 含义 可 
以 不 同 , 既 可 以 是 生 油 止 陷 中 的 一 个 生 油层 系 ,又 可 以 是 次 一 级 构造 单元 中 的 生 油 层 系 , 还 
可 以 是 局 部 构造 等 。 基 于 不 同 的 找 油 理论 ,资源 量 的 估算 方法 也 不 一 样 , 但 是 任何 一 个 局 部 
含油 气 地 质 单元 的 油气 资源 量 却 都 是 与 油气 资源 量 相关 的 地 质 参数 (常数 和 变量 ) 的 连 乘 
积 , 即 油气 资源 量 估算 概率 模型 的 通 式 为 ; 
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QQ = K,TTX， (8-7) 
式 中 Q ,一 一 含油 气 区 内 第 7 个 局 部 地 质 单元 的 油气 资源 量 ; 
Kj; 一 一 第 j 个 局 部 地 质 单元 内 与 油气 资源 量 有 关 的 地 质 常数 与 经 验 系数 的 积 ; 
X; 一 一 第 j 个 局 部 地 质 单元 内 与 油气 资源 量 有 关 的 第 i 个 随机 变量 。 
估算 局 部 含油 气 地 质 单 元 的 油气 资源 量 , 实 际 上 就 是 求 式 (8-7) 的 数学 期 望 , 即 


E(Q,) = KE( || X;) (8-8) 
i= 1 


由 式 (8-8) 可 知 , 当 K; 中 包含 局 部 含油 气 地 质 单元 的 面积 时 ,估算 局 部 含油 气 地 质 单 
元 油气 资源 量 的 关键 是 求 单位 面积 的 资源 量 。 

二 、 油 气 资 源 量 的 估算 

1. 最 大 、 最 小 可 能 资源 量 及 累积 频率 区 间 间 隔 值 

为 了 求 资源 量 的 分 布 曲 线 ( 分 布 函数 ) ,在 资源 量 估 算 之 前 , 先 求 出 第 ;个 局 部 地 质 单 元 
资源 量 的 最 大 、 最 小 可 能 值 和 累积 频率 区 间 间 隔 值 。 

(1) 最 大 可 能 值 。 


djmax 一 RX (J = 1 ,2,* ,7n) 
Ll 


(2) 最 小 可 能 值 。 


Cjmin = K; | | Kim (7 -一 1 ,2 »771 ) 


(3) 频率 区 间 间 隔 值 。 若 累积 频率 区 间 数 为 w, 那 么 区 间 间 陋 值 为 : 
qn 一 Gin 十 [Cg — qjmin)/v (ho 1) (h=1,2,.…,v 十 1) 
2， 油气 资 源 量 的 估算 
(1) 随机 抽样 的 插值 计算 。 F C0) 
如 果 采 用 经 验 分 布 函数 抽样 法 对 随机 变量 X; 
(i 二 1,2,…,n) 进 行 随 机 抽样 , 则 需要 在 计算 机 内 存 
储 Xi 分 布 曲 线 上 的 x 个 控制 点 (zyEF (xis ))(p 二 







(x psF ‘(x ip)) 
Ce, 1) 


(xip+t1is PF (Xjip+1)) 


1,2,…*,U)。 当 抽样 点 (zxjs yr) 落 人 控制 点 (zip， 0 

FPCzn)) 与 (zoliyE'Czoh)) 之 间 时 (图 8-4), 随 人 
机 变量 的 抽样 值 用 插值 法 (线性 或 非 线性 ) 求 出 。 寿 图 8-4 线性 插值 示意 图 
按 线 性 插值 计算 ,那么 第 g 次 的 抽样 值 x;s(g 二 1， 

2,.，， ,和 NN) 为 ， 


r= FF (wes) /LE Crii) F (xip) | 
(j= 1,2,00 ,mii = 1,2,0 np = 1,2, Ug = 1,2,,N) 
式 中 x 一 一 伪 随 机 数 序列 中 的 第 个 伪 随 机 数 。 
(2) 油气 资源 量 个 算 。 
把 随机 变量 Xi 的 抽样 值 zi (i 二 1,2,…,n;g 二 1,2,… ,NN) 代 入 式 (8-7), 得 到 第 ;个 局 
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部 地 质 单元 油气 资源 量 的 估计 值 : 
dig 一 K, TI x (g = 1],2,",N) 


(3) 第 ; 个 局 部 地 质 单元 油气 资源 量 分 布 函 数 。 
根据 第 ) 个 局 部 地 质 单元 油气 资源 量 区 间 间 隔 值 
gq ,用 频率 统计 方法 求 出 g 的 分 布 函数 EEC)( 图 8-5)。 
3. 油气 资源 总 量 dj min 4/ 
如 果 含 油气 区 共有 mx 个 局 部 含油 气 地 质 单元 ,那么 
合 油 气 区 的 油气 资源 总 量 为 m 个 油气 资源 量 的 概率 和 : 


d 一 之 19 
一 


概率 求 和 的 大 致 过 程 如 图 8-6 所 示 。 


图 8-5 资源 量 分 布 函 数 示 意图 





图 8-6 油气 资源 量 的 概率 和 示意 图 


三 、 地 质 风险 分 析 

由 于 石油 勘探 的 未 来 成 效 具 有 不 确定 性 ,因而 需要 对 估算 的 石油 资源 量 进行 风险 分 析 。 
石油 勘探 中 的 风险 是 多 种 多 样 的 ,如 勘探 区 是 否 具备 形成 油气 藏 的 地 质 条 件 的 风险 ;在 具备 
形成 油气 藏 地 质 条 件 的 含油 气 区 内 ,能 否 找到 一 定 规 模 的 油气 藏 的 勘探 风险 ,勘探 后 发 现 的 
油气 藏 是 否 具 备 开 采 价 值 的 经 济 风险 ;勘探 过 程 中 人 与 设备 是 否 安 全 的 环境 风险 ;对 于 勘探 
地 区 ,特别 是 大 陆架 地 区 是 否 有 国际 争议 的 政治 风险 等 。 

油气 资源 评价 为 油气 勘探 提供 决策 依据 ,而 油气 资源 估算 是 资源 评价 的 组 成 部 分 。 因 
此 ,地 质 人 员 要 对 上 述 风险 下 估算 的 油气 资源 量 做 好 地 质 风险 分 析 。 在 实际 的 工作 中 ,地 质 
风险 分 析 可 以 在 不 同 的 层次 进行 ,如 单一 地 质 圈 闭 的 风险 分 析 , 一 组 地 质 圈 闭 ( 国 外 将 地 质 
条 件 相 似 的 一 组 地 质 圈 闭 称 做 一 个 勘探 层 ) 的 风险 分 析 , 一 个 油气 聚集 带 的 风险 分 析 , 整 个 
含油 气 盆地 的 风险 分 析 等 。 

地 质 风 险 分 析 大 多 从 圈 闭 做 起 ,其 风险 的 计算 公式 为 ; 


K=1— [0—&) (8-9) 
式 中 K 一 一 圈 闭 风险 值 ; 
&; 一 一 第 ;个 因素 的 风险 值 。 
例如 ,大 用 容积 法 估算 圈 闭 的 石油 储量 , 则 有 : 
Q=S.H.pg.D.W (8-10) 
式 中 QQ@ 一 一 石油 储量 ; 
S 一 一 含油 面积 ; 
晶 一 一 储 集 层 厚 度 ， 
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go 一 一 储 集 层 筷 际 度 ; 
一 一 石油 充满 系数 ; 
W 一 一 采 收 率 。 
对 储量 进行 风险 分 析 ,就 要 由 熟悉 含油 气 区 地 质 资料 的 人 员 对 上 式 等 号 右边 的 五 项 参 
数 逐 个 分 析 论 证 。 通 常 来 说 ,S 的 风险 常常 取决 于 地 质 调查 或 地 震 勘 探 资料 的 可 靠 性 ;于 的 
风险 受 宕 性 岩 相 变化 的 影响 ;og 的 风险 取决 于 储 集 层 和 孔隙 是 否 有 次 生 改 造 或 后 期 充填 的 影 
响 ;D 的 风险 受 生 油 岩 的 成 熟 度 和 油气 运 移 通 道 的 制约 ;W 的 风险 则 与 原油 性 质 及 驱动 类 
型 有 头 。 
经 过 风险 分 析 论 证 ,对 每 个 参数 给 出 风险 值 有 
(0 和 & 委 1)。 目 前 尚 无 完善 的 方法 确定 风险 值 , 一 种 方 
法 是 由 分 析 论 证 人 凭 经 验 指定 ; 另 一 种 方法 是 借用 地 质 
条 件 类 似 的 临 区 的 风险 值 。 例 如 , 某 个 地 质 圈 闭经 风险 
分 析 论 证 后 给 出 表 8-1 所 示 风 险 值 ,根据 表 内 数据 , 按 
式 (8-9) 计 算 该 圈 闭 的 风险 值 KK 二 0. 65, 而 保险 值 为 = 
0. 35, 即 经 过 风险 分 析 后 该 地 质 圈 闭 的 石油 储量 仅 是 风 
险 分 析 前 的 35 听 (图 8-7) 。 图 8-7 风险 分 析 前 后 石油 储量 关系 
表 8-1 单一 地 质 圈 闭 风险 数据 





地 质 参 数 


含油 面积 
储 集 层 厚 度 
储 集 屋 筷 际 度 
石油 充满 系数 

末 收 率 





如 朱 有 一 组 (10 个 ) 在 地 质 条 件 上 相 类 似 的 可 能 含油 气 图 闭 , 按 式 (8-10) 估 算 它 们 的 石 
油 储量 ,经 过 分 析 论 证 ,给 出 地 质 圈 闭 的 各 项 参数 风险 值 ( 表 8-2) ,那么 在 该 组 地 质 圈 闭 中 
获得 一 个 油 藏 的 可 能 性 有 多 大 ? 
表 8-2 一 组 可 能 含油 图 闭 的 风险 数据 


到 


区 
E 
对 于 这 个 问题 有 两 种 计算 方法 : 


中 考虑 所 有 地 质 参 数 的 影响 ,在 该 组 可 能 含油 的 地 质 圈 闭 中 发 现 一 个 油 藏 的 风险 值 





K= |I[1- IT 0 —&%)] = (1 —0.25) = 0.056 3 
而 在 该 组 可 能 含油 的 地 质 圈 闭 中 发 现 一 个 油 藏 的 保险 值 
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P=1—K=1—0.0563=0.9437 
即 发 现 一 个 油 藏 的 可 能 性 为 94. 4 多 。 
@ 回 仅 考 虑 最 不 利 的 地 质 参 数 的 影响 ,在 该 组 可 能 含油 的 地 质 圈 闭 中 发 现 一 个 油 藏 的 风 
仿 值 


10 
K= |[[k= (1—0.5)" = 0.000 98 


而 在 该 组 可 能 含油 的 地 质 圈 闭 中 发 现 一 个 油 藏 的 保险 值 
P=1i—K = 0.999 02 
即 发 现 一 个 油 藏 的 可 能 性 为 99.9% 。 
进行 地 质 风 险 分 析 时 ,如 果 地 质 参数 间 具 有 多 层次 结构 , 则 应 计算 复合 地 质 风险 值 。 例 
如 , 探 区 的 地 质 风 险 取决 于 生 油 和 储 油条 件 , 而 生 油条 件 与 生 油 层 厚 度 及 生 油 相 带 有 关 :; 储 
油条 件 与 储 层 厚度 及 储 层 相 带 有 关 。 经 过 分 析 论 证 ,给 出 复合 地 质 风险 值 ( 表 8-3) 。 
表 8-3 复合 地 质 风 险 值 


生 油 条 件 0, 4 0. 6 


储 油 条 件 0. 37 0. 63 


复合 地 质 风险 值 可 按 下 式 计算 : 


mn mm 刘 


各 1— -0 1 | 1k) (8-11) 


式 中 KK 一 一 复合 风险 值 ; 
ki 一 一 第 j 项 复合 地 质 因 素 的 第 i 个 基础 地 质 因 素 的 风险 值 。 
根据 表 8-3 中 的 数据 , 按 式 (8-11) 计 算 , 复 合 地 质 因 素 风 险 值 
K=1—(0.6X0.1) x (0,9x0.7) = 0.9622 

在 本 例 中 ,地 质数 据 结 构 为 两 层 , 当 结构 层次 多 于 两 层 时 ,复合 地 质 风险 值 的 计算 将 复 
杂 一 些 。 

四 、 风 险 分 析 后 资源 总 量 的 估算 

右 含 油气 区 内 第 7 个 局 部 含油 气 地 质 单元 油气 资源 量 的 分 布 函数 为 下 (9 ) ,地 质 风险 
值 为 ,保险 值 为 1 一 ,那么 在 重新 估算 合 油 气 区 地 质 风 险 分 析 后 的 油气 资源 总 量 时 , 随 
机 抽样 人 人口 值 的 分 布 区 间 应 由 [0,1j 变 为 [0,1 一 &;] (图 8-7)。 因 此 ,应 将 [0,1] 上 分 布 的 随 
机 数 xr, 改造 为 [0,1 一 kj 上 分 布 的 随机 数 xr* , 目 rr* 二 (1 一 k&j;)r,。 

在 以 上 基础 上 ,仍然 用 插值 的 方法 求 出 风险 分 析 后 g; 的 抽样 值 gj (7 = 1,2,…,m;a 一 
1,2,…,N) ,再 由 qj 求 得 油气 资源 总 量 估计 值 9,(a 二 1,2,…,NN) ,最 后 利用 频率 统计 法 求 
出 地 质 风 险 分 析 后 资源 总 量 的 分 布 函数 F(g)。 


5 应 用 实例 
某 沉积 盆地 中 的 一 个 地 质 四 陷 有 三 套 生 油层 系 。 用 氮 仿 浙 青 法 估算 该 四 陷 的 远景 石油 
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资源 量 , 各 生 油 层 系 的 石油 资源 量 估 算 公式 为 ; 
Qi = S;»* H;. D.A,.k.k; (‘8-12) 
式 中 QQ 一 一 第 j 套 生 油层 系 的 石油 资源 量 ; 
S, 一 一 第 j 套 生 油 岩 的 分 布 面积 ,km ; 
有 HH; 一 一 第 ; 套 生 油 岩 的 厚度 ,m; 
吃 一 一 生 油 岩 密 度 , X10 t/km;; 
A 一 一 第 j 套 生 油 岩 氯 仿 沥 青 含量 ,7 ; 
ki 一 一 排 烃 系 数 ; 
ks 一 一 诊 集 系数 。 
凹陷 石油 资源 量 为 三 套 生 油层 系 资源 量 的 和 。 三 套 生 油层 系 的 地 质 参 数 匈 表 8-4。 
表 8-4 人 


se 第 一 套 生 油层 系 第 二 套 生 油 层 系 第 三 套 生 油层 系 
地 质 参 数 


排 烃 系数 0, 44 0. 48 0. 43 





对 于 某 生 油层 系 ,其 分 布 面 积 、 密 度 为 常数 ; 排 烃 系数 .聚集 系数 是 经 验 系数 ; 生 油 兰 犀 
度 . 生 油 岩 氯仿 沥青 含量 为 有 一 定 取 值 范围 的 随机 变量 ,其 分 布 函 数 如 图 8-8 所 示 。 
不 同 概率 下 三 套 生 油层 系 的 石油 资源 量 及 全 凹陷 石油 资源 总 量 见 表 8-5。 
表 8-5 各 生 油层 及 全 思 陷 石油 资源 量 汇总 表 





第 一 套 生 油 岩 第 二 套 生 油 岩 第 三 套 生 油 兰 
石油 资源 量 /( 关 108 1) | 石油 资源 量 /(X103 t | 石油 资源 量 /( X10 +) 


全 四 陷 石油 总 
资源 量 /(X10s +t) 





11.546 8 
16.668 7 
17.949 2 
18. 863 8 
19. 595 5 
20. 144 3 
20.693 1 
21.241 8 
21.973 5 
22.705 3 
25.815 0 
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F(O) 0.6 
0.4 
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第 一 套 生 油 岩 石油 资源 量 分 布 函 数 


10 
0.8 


F(@) 0.6 
0.4 
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0.0 
3.8159 7 4832 2.4887 
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F(Q) 0.6 
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1.952 7 6.7584 8.6536 
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外 陷 石 油 资源 量 分 布 函数 


图 8-8 生 油 岩 生 油 参数 及 石油 资源 量 分 布 函数 
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思考 与 练习 

1. 蒙特 卡 罗 法 的 现代 含义 是 什么 ? 

2. 对 随机 变量 进行 随机 抽 祥 时 ,为 何 要 产生 [0,1j 上 的 随机 数 ? 

3， 如 何 构造 地 质 随机 变量 的 经 验 分 布 函数 ? 马 与 概率 论 中 随机 变量 的 分 布 函 数 有 何 
不 同 ? 

4. 0 如 何 实现 对 随机 变量 的 随机 抽样 ? 常用 的 抽样 方法 有 几 种 ? 其 
各 自 的 适用 条 件 是 什么 

5, ee eg 

6. 应 用 蒙特 卡 罗 法 求 数值 解 不 确定 问题 概率 解 的 基本 过 程 是 什么 ? 

7. 根据 地 震 资 料 和 少量 钻井 资料 ,获得 菜 凹 陷 下 第 三 系 某 储 集 层 的 厚度 数据 ( 表 8-6)， 

表 8-6 储 集 层 厚 度数 据 表 
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第 九 章 “地 质数 据 序列 分 析 


在 地 质 研究 中 ,有 很 多 地 质变 量 的 观测 值 会 构成 一 个 有 序 的 数据 序列 ,例如 沿 地 层 放 面 
或 销 井 岩心 剖面 上 地 层 的 厚度 .矿物 的 成 分 . 电 性 曲线 和 模拟 地 震 记 录 离 散 抽 样 .数字 地 震 
记录 等 ,这 种 有 序 的 地 质数 据 描 述 了 地 质 特征 的 变化 。 因 此 ,地 质数 据 序 列 是 描述 地 质 特 征 
的 地 质变 量 的 观测 值 按 观测 顺序 排列 的 数据 序列 , 记 为 ， 
晨 一 (Z19zay To) 
地 质数 据 序列 分 析 是 研究 多 个 地 质数 据 序 列 间 的 相互 关系 .自身 性 质 等 的 统计 分 析 方 
法 。 在 此 仅 介 绍 人 简单 的 相关 分 析 和 滑动 平均 。 


S1T 相关 分 析 


相关 分 析 本 质 上 是 一 种 线性 滤波 ,是 数字 地 震 资 料 的 一 种 基本 处 理 方法 。 它 不 仅 是 压 
制 随机 干扰 、 提 高 讯 噪 比 的 一 种 重要 的 滤波 方法 ,同时 还 在 识别 和 消除 多 次 波 、 计 算 速 度 谱 、 
确定 同 相 轴 的 基本 参数 等 方面 都 有 着 广泛 的 应 用 。 地 震 勤 探 中 一 种 独特 的 方法 一 一 连续 振 
动 法 也 是 根据 相关 分 析 原 理 提出 的 。 在 此 ,我 们 把 地 质数 据 序列 视 为 一 个 波形 的 离散 抽样 ， 
并 从 波形 的 相似 出 发 ,引出 表示 波形 相似 程度 的 相关 消 数 ,分 析 相 关 录 数 的 性 质 , 人 简单 介绍 
相关 分 析 在 地 质数 据 序列 研究 中 的 应 用 。 

一 、 相 关 函 数 

对 于 波形 之 间 的 相似 性 问题 ,有 时 从 和 直观 上 就 可 以 看 出 “这 两 个 波形 比较 相似 ”,“ 那 两 
个 波形 不 大 相似 ”。 例 如 ,波形 zi (09 与 y(t) 不 相似 ,而 zz (与 yo(z) 很 相似 (图 9-1)。 但 
有 时 就 不 一 定 能 从 直观 上 做 出 这 样 的 定性 判断 ,即使 能 做 出 定性 判断 ,那么 它们 又 相似 到 什 
么 程度 呢 ? 下 面 对 此 问题 进行 讨论 。 


DD AN / \/ 人， Xx2{1) 
y(n “人 AAA 


图 9-1 波形 的 相似 性 示意 图 
设 XT 和 y， yy2 9 yar 是 x (zt) 和 y(t) 等 间隔 的 离散 抽样 值 , 则 它们 的 均 方差 
0 一 > (a = 
反映 了 两 个 波形 的 相似 程度 。o 越 大 ,zx(2) 与 y( 引 的 相似 程度 就 越 低 ; 反 之 ,x (2) 与 y(2) 的 
相似 程度 就 越 高 。 把 上 式 展 开 , 得 : 


证 


二 lv 2 
0 一 吉 和 二 志和 7 


i—1 


由 上 式 可 知 ,两 个 波形 的 相似 程度 取决 于 
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0 一 2 Pay, (9-1) 
的 大 小 (注意 g 是 可 正 可 负 的 )。g 小 则 oa 大 ,两 个 波形 整体 的 相似 程度 低 ; 反 之 ,两 个 波形 
整体 的 相似 程度 高 。 
在 实际 工作 中 ,讨论 两 个 波形 的 相似 性 时 ,不 仅 要 从 整体 上 分 析 它 们 的 相似 程度 ,而 且 
还 要 分 析 不 同 波形 上 的 相似 段 , 即 两 个 波形 中 的 一 个 相对 于 另 一 个 移动 时 ,移动 到 什么 位 置 
它们 最 相似 。 例 如 , 粗 看 zx;(2) 与 y; (2) 是 很 不 相似 的 ,但 仔细 观察 可 以 发 现 x; (1) 的 AB 段 
与 ys(1t) 的 CD 段 很 相似 (图 9-2) 。 


wl) 人 人 NAA 人 
ys(!) 个 人 人 AA 


图 9-2 波 的 相似 段 
为 了 确定 不 同 波形 上 最 相似 的 段 ,我 们 计算 两 个 波形 相对 移动 不 同位 置 时 的 p 值 , 即 


p(T) = Dr (rz 一 riyrz，…) (9-2) 

式 中 rt 一 一 数据 序列 的 滞后 项 数 。 

令 z 一 mc 可 计算 出 g(r) ,glrs),…, 当 两 个 波形 相似 的 段 (AB 和 CD) 恰 好 重合 
时 ,gp(z) 最 大 。 由 此 可 知 , 式 (9-2) 是 定量 衡量 两 个 波形 相似 程度 的 指标 ,我 们 可 以 利用 它 确 
定 两 个 波形 中 的 相似 段 。 另 外 ,g(r) 不 仅 与 两 个 波形 本 身 的 特点 有 关 , 而 且 还 与 两 个 波形 之 
间 的 相对 移动 量 有 关 。w(r) 称 为 两 个 波形 的 相关 函数 。 

二 、 互 相关 和 自 相关 函数 

1. 互相 关 函 数 

若 z( 四 ,y(z) 是 两 个 不 同 的 波形 , 则 称 式 (9-2) 为 z(t) 和 y(4) 的 互相 关 函 数 , 常 记 为 ， 


pa (Tt) 一 ~ Dl yr (9-3) 
i=1 


由 
pm (T) 一 元 YC)T(E + rdz (9-4) 


一 般 来 说 ,互相 关 冰 数 不 是 偶 函 数 ,p., (0) 不 一 定 是 最 大 值 。 最 大 值 一 般 在 两 个 波形 的 
最 大 相似 段 上 。 当 z 趋 于 无 穷 大 时 ,p。(r) 趋 于 0。 
2， 自 相关 函数 


当 z(2) 二 y(t) 时 , 则 称 式 (9-2) 为 z() 的 自 相 关 函 数 , 常 记 为 ， 


prr (T) 一 ~ Dziri, (9=5) 
i=1 
T 
p(n) = 示 | x (Dz nd (9-6) 


目 相 关 函 数 的 图 形 以 we- (r) 为 对 称 轴 ( 图 9-3) , 即 pn (zz) 一 0 一 z)， 也 就 是 说 自 相 关 
明 数 是 c 的 侦 函 数 。 当 r==0 时 ,pu (0) 为 正 的 最 大 值 ; 当 r 赵 于 无 穷 大 时 ， px (rz) 赵 于 0。 
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图 9-3 波形 及 其 自 相 关 函 数 曲线 
2 少 动 平 专 

地 质数 据 序列 中 的 每 个 观测 值 均 包含 趋势 (背景 ) 变 化 周期 性 变化 和 随机 干扰 三 部 分 ， 
其 中 对 油气 勘探 有 用 的 信息 是 趋势 和 周期 性 成 分 。 因 此 ,在 通过 地 质数 据 研究 地 质问 题 时 ， 
应 尽量 消除 或 抑制 数据 序列 中 的 随机 干扰 。 在 此 介绍 一 种 消除 或 抑制 随机 干扰 的 简单 方 
法 一 滑动 平均 法 。 下 面 是 常用 的 几 个 滑动 平均 方程 ， 

1，3 项 滑动 平均 方程 

3 项 滑动 平均 是 以 数据 序列 中 zx; 为 中 心 ,左右 各 取 1 个 相 邻 数据 的 加 权 ( 权 相等 ) 平 
均 , 相 应 的 方程 为 : 





3 (Xx; 十 Xi 十 X41)/3 (1 CC—= 2,3," ,nn 1) (9-7) 
滑动 平均 过 程 如 下 所 示 : 
32 DA 
DE Ne a 
六 MW 3 Td Ts we 7 Xt 
一 
.3 Ys 


2. 5 项 滑动 平均 方程 
5 项 滑动 平均 是 以 数据 序列 中 z; 为 中 心 ,左右 各 取 2 个 相 邻 数据 的 加 权 ( 权 不 等 , 离 中 
心 点 越 远 , 权 越 小 ) 平 均 , 相 应 的 方程 为 ; 
多 一 Ll7z; 十 12(zral 十 Zi) 一 3(zts ris) |]/35 (一 3,4，…… 7 一 2) 
(9-8) 
滑动 平均 过 程 如 下 所 示 : 


y4 

3, 7 项 滑动 平均 方程 

7 项 滑动 平均 是 以 数据 序列 中 x; 为 中 心 ,左右 各 取 3 个 相 邻 数据 的 加 权 ( 权 不 等 , 离 中 
心 点 越 远 , 权 越 小 ) 平 均 , 相 应 的 方程 为 : 

Ji 一 [7zi 十 6(ztl 十 Zi) 十 3(zaz 十 ZrPa) 一 2(0zas 十 Ts)] /21 
(一 4,5 :72 一 3) (9-9) 

滑动 平均 过 程 与 上 类 似 。 

4. 9 项 滑动 平均 方程 

9 项 滑动 平均 是 以 数据 序列 中 zx; 为 中 心 ,左右 各 取 4 个 相 邻 数据 的 加 权 ( 权 不 等 , 离 中 
心 点 越 远 , 权 越 小 ) 平 均 , 相 应 的 方程 为 : 
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0 31[7zx; 0; 16(xiii 十 X11) 十 0.08(xiz 十 广 ; 2) 
— O04( x = wo 十 0, O02(C Xx, 中 | ) | 


(i = 5,6,.…,n— 4) (9-10) 
滑动 平均 过 程 与 上 类 似 ，。 z 


5. 11 项 滑动 平均 方程 


11 项 滑动 平均 是 以 数据 序列 中 zx; 为 中 心 ,左右 各 取 5 个 相 邻 数据 的 加 权 ( 权 不 等 , 离 
中 心 尽 越 远 , 权 越 小 ) 平 均 ;相应 的 方程 为 


YE | 89x; 上 84(ral 十 1) 十 69(xi4e | 


十 44 (Tir 十 ed ) 十 QC 十 ;ay 二 36( 工 ;5 十 Ti5 ) |/429 


(1 = 6,7,**,n—5) (9-11) 
请 动 平均 过 程 与 上 类 似 。 


6. 15 项 滑动 平均 方程 
15 项 滑动 平均 是 以 数据 序列 中 zi 为 中 心 ,左右 各 取 7 个 相 邻 数据 的 加 权 ( 权 不 等 , 离 
中 心 点 越 远 , 权 越 小 ?平均 ,相应 的 方程 为 : 
入 一 [74z 十 67(zrl 十 zi) 十 46(zss 十 Xz) 十 21(xs 十 x,) 
十 34zi 十 Xa) 一 5(xis 十 Xs) 一 6(x6 十 Zi) 一 3Cziy 二 x; 17) |/320 


(i = 8,9,."…,n— 7?) (9-12) 
滑动 平均 过 程 与 上 类 似 。 


7. 21 项 滑动 平均 方程 
21 项 请 动 平 均 是 以 数据 序列 中 z; 为 中 心 , 左 右 各 取 10 个 相 邻 数据 的 加 权 ( 权 不 等 ,高 
中 心 点 越 远 , 权 越 小 ) 平 均 , 相 应 的 方程 为 ， 
yi = [60z; 二 57(Czxa 十 zi) 十 47(zi 十 zz) 十 9) 
十 18(za 十 Xi) 十 6(xins 十 Ts) 一 2Cxie 十 io) 一 5(Czy 十 之 ，) 
一 有 50 
(一 1]1,12, 1 一 10) (9-13) 
请 动 平均 过 程 与 上 类 似 。 
上 述 各 式 中 ,zx; 是 原始 观测 值 ;y; 是 滑动 平均 后 的 新 数据 ;n 为 数据 序列 的 长 度 。 


S3 应 用 实例 
【 例 1] 数 据 序 列 的 周期 性 分 析 。 


对 美国 绿 河 (Green River) 油 页 岩 季候 泥 厚 度数 据 ( 表 9-1) 进 行 标 准 差 标准 化 后 做 自 相 


关 分 析 , 并 分 别 以 g(r) 和 + 为 纵 、 横 坐标 绘制 自 相 关 图 (图 9-4)。 由 图 可 以 看 出 ,季候 泥 
厚度 的 变化 具有 20 年 的 周期 ,这 与 太阳 黑子 22 年 的 活动 周期 


接近 ,由 此 表明 ,季候 泥 厚 度 的 变化 与 太阳 黑子 的 活动 有 关 。 ” 芝 中 
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图 9-4 油 页 崖 季候 泥 分 层 
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表 9-1 绿 河 油 页 兰 季 候 泥 厚度 数据 


ws [rT Ts TT lo ol TT 
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【 例 23 确 定 断 层 断 点 位 置 与 落差 。 
有 相 邻 的 两 口 井 Nol 和 No2, 其 中 Nol 井 通过 一 条 断层 (图 9-5a)。 对 两 井 的 部 分 对 比 
电 测 曲线 以 1 m 的 深度 间隔 采样 ,形成 数据 序列 ( 表 9-2 和 9-3) 。 


名 籽 


六 赴 站 往 
新 洲 





(b) 


图 9-5 钻井 前 面 及 前面 对 比 过 程 示 意图 
表 9-2 Nol 井 电 测 曲线 采样 值 
na 
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对 具有 断层 ,地层 尖 灭 .不 整合 面 等 复杂 地 质 现象 的 地 层 放 面 进行 对 比 时 , 相 邻 剖面 间 
会 不 止 一 次 地 出 现 相似 的 层 段 ,由 此 绘 出 的 互相 关系 数 曲线 也 就 有 多 个 峰值 ,每 个 峰值 对 应 
一 个 最 大 (相对 ) 相 关 段 , 它 隐 含 着 一 定 的 地 质 意 义 。 在 此 情况 下 ,就 要 仔细 分 析 、 研 究 这 些 
最 大 相关 段 在 地 质 上 的 意义 。 现 以 具有 断层 的 地 层 前 面 对 比 为 例 , 说 明 寻 找 两 个 训 面 上 的 
最 大 相关 段 .确定 断 点 位 置 和 斯 层 落差 的 过 程 。 

如 果 把 整个 对 比 过 程 分 为 N 段 , 那 么 互相 关系 数 曲线 会 出 现 NN 个 峰值 ,在 每 段 内 找 出 
峰值 对 应 的 最 大 相关 段 , 由 此 可 以 找 出 NN 个 最 大 相关 有 段 , 其 中 包括 处 于 图 9-5b 及 9-5c 位 置 
时 的 两 个 最 大 相关 段 。 现 在 分 析 这 两 个 最 大 相关 段 的 特点 : 当 对 比 段 处 在 图 9-5b 的 位 置 
时 ,对 比 段 明显 地 分 为 两 部 分 ,下 部 地 层 相 同 , 即 Nol 井 断 层 的 上 升 盘 地 层 与 No2 井 相 对 地 
层 是 同 层 ;上 部 地 层 不 同 , 即 Nol 井 断 层 的 下 降 盘 地 层 与 No2 井 相对 地 层 不 是 相同 的 地 层 。 
根据 上 述 特点 ,计算 该 段 (图 9-5b 段 ) 上 的 累加 相关 系数 公式 为 ， 






9p(i) 一 2 (9-14) 
Pi 1 
式 中 : 


LA 





累加 相关 段 号 ; 
第 ;个 累加 相关 段 内 数据 的 个 数 ; 
ya 一 一 第 :个 累加 相关 段 内 y,z 的 第 有 & 个 采样 值 。 

计算 累加 相关 系数 时 ,最 大 相关 有 段 中 的 两 个 数据 序列 不 再 移动 , 仅 是 从 上 部 开始 ,依次 
增 大 计算 累加 相关 系数 的 累加 长 度 。 从 开始 到 渐 点 DD, 因 为 最 大 相关 段 上 部 两 个 剖面 对 
应 的 地 层 不 同 , 所 以 计算 出 的 累加 相关 系数 会 很 小 ;过 了 DD 点 后 ,对 应 地 层 相 同 ,累加 相关 
系数 从 此 点 开始 增 大 ,在 累加 相关 系数 曲线 上 将 会 出 现 一 个 明显 的 台阶 (图 9-5b) ,这 个 台 
阶 指示 的 位 置 即 为 Nol 井 内 断 点 的 位 置 , 它 在 No2 井 内 对 应 的 深度 为 DDl1。 同 理 ,在 图 
9-5c 的 位 置 时 ,累加 相关 系数 曲线 会 出 现 一 个 相反 的 台阶 , 它 也 指示 了 Nol 井 内 断 点 的 位 
置 ,该 位 置 在 No2 井 内 对 应 的 深度 为 DD2。DD1 与 DD2 的 差 即 为 断层 的 落差 。 

根据 六 条 累加 相关 系数 曲线 的 特点 ,分 析 放 面 上 的 地 质 现 象 ,可 更 有 效 地 进行 地 层 对 
比 。 在 Nol 和 No2 井 对 比 结果 图 (图 9-6) 的 累加 相关 系数 曲线 上 看 出 ,在 序号 为 70 处 出 
现 台 阶 。 但 是 我 们 计算 累加 相关 系数 的 初始 长 度 为 5, 因此 ,新 点 位 置 应 在 序号 75 处 , 即 
Nol 并 的 1 650 m 深 处 ,也 就 是 Nol 井 缺 失 了 No2 井深 度 为 1 730 m 以 上 的 地 层 。 

【 例 3 抑制 随机 干扰 。 

利用 不 同 的 滑动 平均 方程 ,消除 或 抑制 季候 泥 厚 度数 据 序列 中 的 随机 干扰 ,绘制 新 数据 
的 曲线 (图 9-7) 。 与 原始 数据 曲线 相 比 ,消除 或 抑制 随机 干扰 后 的 曲线 更 光滑 。 
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04 68 13.2 19.6 04 68 13.2 19.6 -1 0 +l 

1660.0 1 580.0 FL 
1665.0 1 585.0 Ce . 10 所 
1670.0 1 590.0 15 
1675.0 1 595.0 20 
1680.0 1 600.0 25 
1685.0 1 605.0 30 
1690.0 1 610.0 35 
1695.0 1615.0 40 
1700.0 1 620.0 45 
1705.0 1 625.0 50 
1710.0 1630.0 55 
1715.0 1 635.0 €0 
1720.0 1 640.0 65 
1725.0 1645.0 

0 以 上 地 层 Nol 井 缺失 1 650.0 2 代 断 点 
1735.0 1655.0 80 
1740.0 1 660.0 85 
1745.0 1 665.0 90 
1750.0 1 670.0 95 
1755.0 8 1675.0 100 
1760.0 1 680.0 105 
1765.0 1 685.0 110 
1770.0 1 690.0 115 
1775.0 1 695.0 120 
1780.0 1 700.0 125 
1785.0 1 705.0 130 
1 790.0 1710.0 135 
1795.0 1 715.0 pt 
1 800.0 1 720.0 Pe 
1 805.0 1725.0 0 
1810.0 1 730.0 134 
1815.0 1735.0 150 
1820.0 1740.0 165 
1825.0 1 745.0 6 
1830.0 1 750.0 1 
1835.0 1755.0 je6 
1840.0 1760.0 je 
1 845.0 1 765.0 0 
1850.0 1770.0 1 
1855.0 1 775.0 2 
18600 1 780.0 3 
1865.0 1785.0 210 
1870.0 1 790.0 6 
1875.0 1 795.0 23 
1880.0 1 800.0 3 
1885.0 1 805.0 7。 
1890.0 1 810.0 5 
1895.0 1 815.0 

(a) No2 (b) Nol (c) 累加 相关 系数 


图 9-6 对 比 结果 图 
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14.0 
11.8 
9.4 
7.3 
5.0 
0 11.0 21.0 310 40 51.0 610 710 80 910 101.0 
七 项 方程 滑动 平均 后 的 曲线 
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9.5 
7.3 
5.0 
2.8 
1.0 11.0 21.0 31.0 41.0 S51.0 61.0 71.0 81.0 91.0 101.0 
五 项 方程 滑动 平均 后 的 曲线 
14.0 
11.8 
9.5 
7.3 
$.0 
2.8 
1.0 11.0 21.0 31.0 41.0 51.0 61.0 71.0 81.0 91.0 101.0 
原始 数据 曲线 
图 9-7 滑动 平均 后 的 曲线 图 
思考 与 练习 
1. 什么 是 有 序数 据 序列 分 析 ? 
2. 什么 是 自 相 关 、 互 相关 分 析 ? 
3. 地 质 学 中 的 哪 一 类 问题 属于 相关 分 析 的 研究 对 象 ? 
4. 试 述 滑动 平均 法 抑制 随机 干扰 的 计算 过 程 。 
5. 试 举例 说 明 有 序数 列 分 析 在 石油 及 天 然 气 地 质 中 的 应 用 。 
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第 十 章 “油气 资源 量 及 含油 气 有 利 地 带 的 预测 


油气 资源 评价 是 贯穿 整个 油气 勘探 开发 过 程 中 的 一 项 工作 ,而 油气 资源 量 及 含油 气 有 
利 地 市 的 预测 则 是 油气 资源 评价 的 重要 任务 之 一 。 

20 世纪 70 年 代 以 来 ,计算 机 技术 的 迅猛 发 展 及 其 在 油气 勘探 开发 中 的 普遍 应 用 ,使 数 
学 地 质 方法 的 应 用 领域 更 加 广泛 ,进而 极 大 地 促进 了 油气 资源 评价 工作 的 进展 , 既 提高 了 评 
价 方法 的 科学 性 ,又 增强 了 评价 结论 的 可 靠 性 。 在 不 同 的 油气 勘探 开发 阶段 ,油气 资源 评价 
的 任务 .依据 的 理论 基础 也 不 一 样 , 因 此 ,也 就 有 了 不 同 的 油气 资源 评价 方法 。 据 不 完全 统 
计 , 目 前 国内 外 用 于 油气 资源 评价 的 方法 有 百 余 种 ,其 中 大 多 数 方法 属于 油气 资源 量 的 预测 
方法 ,而 预测 探 区 含油 气 有 利 地 带 的 方法 较 少 ,这 是 目前 油气 资源 评价 工作 中 的 一 个 薄弱 环 
方 。 研 究 含 油气 有 利 地 带 的 预测 方法 ,不仅 有 利于 提高 油气 资源 评价 结论 的 可 靠 性 ,更 重要 
的 是 可 用 于 指导 探 区 当前 的 勘探 工作 。 

在 回归 分 析 . 聚 类 分 析 ,趋势 面 分 析 、. 判 别 分 析 、 蒙 特 卡 罗 法 和 模糊 数学 方法 (第 十 一 章 ) 
的 应 用 实例 中 ,扼要 地 介绍 了 几 种 预测 油气 资源 量 和 含油 气 有 利 地 带 的 方法 。 其 中 有 的 方 
法 既 可 以 预测 资源 量 ,也 可 以 预测 含油 气 有 利 地 带 ,这 取决 于 方法 中 所 取 地 质变 量 的 内 涵 。 
在 此 ,介绍 预测 油气 资源 量 的 Weng 旋回 模型 法 .油田 规模 序列 法 .历史 趋势 外 推 法 .地 质 圈 
闭 的 模糊 集合 综合 评价 法 和 多 种 信息 香 合 评价 法 。 


31 油气 资源 量 预测 
一 、Weng 旋回 模型 法 
1.。 Weng 旋回 模型 
若干 个 互相 联系 的 事物 或 意识 构成 的 一 个 整体 称 做 一 个 体系 , 记 为 Q。 如 果 Q@ 具 有 从 
兴起 到 衰亡 的 全 过 程 , 则 称 这 一 全 过 程 为 一 个 生命 旋回 ,并 称 生命 旋回 中 截止 时 间 为 :时 Q 
的 输出 量 为 生命 量 。 如 果 QQ@ 在 :<0 时 不 存在 ,那么 Q 就 是 一 个 不 连续 的 体系 , 记 为 ， 


Qs -所 0 
QQ, i>0 
奉 Q 的 发 展 速 度 dQ/di 正比 于 发 展 过 程 中 Q 的 当前 状态 , 即 
dQ/dt = QL (zx/t)— 1] (zt > 0) (10-1) 


式 中 [(x/?) 一 1] 一 一 比例 因子 ; 
7 一 一 Q 发 展 进入 顶峰 期 后 所 经 历 的 发 展 阶段 数 。 
由 微分 方程 式 (10-1) 得 ， 
Q= At'e” (t > 0) (10-2) 

式 (10-2) 是 我 国 著名 科学 家 侈 文 波 先生 提出 的 一 种 对 生命 总 量 有 限 的 体系 进行 描述 和 
预测 的 模型 , 称 其 为 Weng 旋回 模型 。 由 此 模型 可 以 看 出 :Q 的 兴 训 正比 于 两 个 因子 ,其 兴 
起 正比 于 时 间 上 的 z 次 方 ,其 衰亡 正比 于 时 间 z 的 负 指 数 函 数 。 因 此 ,Q 是 时 间 t 的 函数 ,而 
t 是 时 间 间 隅 与 体系 特征 系数 C 的 比值 ,为 此 把 式 (10-2) 改 写 为 : 


a 
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Q, 一 Aire 
f= (T= T6)/C 
式 中 TT, 一 一 体系 的 起 始 时 刻 ; 


(1t > 0) (10-3) 





T 一 一 体系 发 展 过 程 中 的 某 时 刻 ; 
Z 一 一 某 个 正 整数 ; 
C,A 体系 特征 和 影 啊 系 数 。 





2. Weng 旋回 模型 的 性 质 
(1) dQ, /di 一 AzP le 一 Ate ‘=Arie :COZzAt 一 1)， 即 
dQ,/dti = Q,(zx/t— 1) 
因此 ,Q 的 发 展 速 度 正比 于 发 展 过 程 中 的 当前 状态 ,并 且 
OD 当 0 二 :过 x 时 ,dQ,/dt 之 0, 表示 Q 处 于 兴起 期 ; 
加 当 t 二 zx 时 ,dQ,/dt 二 0, 表 示 Q 发 展 达 到 高 峰 期 ; 
@ 当 t>zx 时 ,dQ,/dt<=<0, 表 示 Q@ 发 展 进 入 衰亡 期 。 
(2) dQ, /df 二 Qt [Gt 一 zx) 一 zj, 故 当 1 二 zx 一 zx 或 :=z 十 zx 时 ,dQ,/drt = 二 0。 
3. 生命 量 与 生命 总 量 
生命 量 是 生命 旋回 中 截止 时 间 为 :时 Q 的 累计 输出 量 , 记 为 >, Q， » 即 


DQ = | Qd= | Ared (10-4) 
生命 总 量 是 生命 旋回 中 截止 时 间 上 为 ce 时 Q 的 累计 输出 量 , 记 为 > .Q , 即 


>. 0 一 | au | Ared 
当 上 式 中 的 x 为 正 整 数 ,t 一 co 时 ,生命 总 量 : 
>)，Q. 一 ArCz 十 1) = Axr! (10-5) 
由 式 (10-4),(10-5) 得 : 


DQ/ 2 Q = 1— er DC/il) (10-6) 


当 z 二 0 时 , 式 (10-6) 等 于 0, 即 体系 截止 时 间 为 0 时 的 生命 量 为 0; 当 t= 二 co 时 , 式 (10-6) 等 
于 1, 表明 体系 的 生命 总 量 是 存在 的 ,并 且 


DN (10-7) 


因此 ,Weng 旋回 模型 是 收 合 的 , 它 适合 于 对 生命 总 量 有 限 的 体系 进行 描述 和 预测 。 

由 上 述 可 知 ,Q 的 发 展 过 程 大 体 上 可 划分 为 加 速 上 升 阶段 (0 二 :< 过 x 一 xz) .一般 上 升 阶 
段 (x 一 x 之 :过 x) ,稳定 阶段 (==zx 土 Az) 一 般 下 降 阶 段 (zx 过 :过 xz 十 x) 以 及 缓慢 下 降 阶 
段 (z 十 Xz 之 1 之 oo) 共 五 个 发 展 阶 段 。 

4. 油田 产量 及 最 终 可 采 储 量 的 预测 

对 于 一 个 油田 来 说 ,从 油田 投产 到 产量 村 竭 是 一 个 生命 旋回 , 它 是 生命 总 量 有 限 的 体 
系 , 因 此 可 以 用 式 (10-3) 和 式 (10-7) 预 测 油田 产量 的 未 来 变化 和 最 终 的 可 采 人 储量。 但是, 油 
田 的 生命 旋回 将 受 开发 措施 和 勘探 等 因素 的 影响 ,因此 需要 根据 所 预测 的 油田 从 投产 年 份 

开始 的 逐年 实际 产量 ,确定 模型 中 的 参数 xz,C 和 A。 






笋 十 最 油 竺 姿 唐 是 及 合 油气 范 和 地 带 的 巴 贡 


(1) 确定 参数 的 原则 。 

设 油 田 的 逐年 产量 为 Q; ,模型 预测 的 产量 为 Q; 二 Arre (tt>>0)。Q 与 Qi 的 相关 程度 
越 高 ,说 明确 定 的 参数 xz,C 和 A 就 越 接近 于 油田 的 实际 。 也 就 是 说 ,应 该 把 Q 与 Q, 的 相 
关 程 度 达 到 最 高 作为 确定 模型 中 参数 的 基本 原则 。 但 是 ,预测 模型 中 有 三 个 参数 ,我 们 只 能 
在 上 述 原则 下 采用 迭代 的 方法 逐个 确定 每 个 参数 ， 

(2) 确定 参数 的 具体 步骤 。 

QD 确定 参数 C 的 初 值 。 

根据 油田 逐年 产量 的 变化 ,给 出 C 的 初始 估计 值 。 

@ 确定 参数 z 的 估计 值 。 

确定 C 的 初 值 后 ,再 进一步 确定 zx 的 估计 值 。 要 求 Q, 与 Q, 最 大 相关 ,实际 上 等 价 于 
要 求 yj; 二 te “与 Q, 最 大 相关 。 因 此 , 令 zo 二 1,2,… ,计算 

Ye 
FT = TC 

的 值 ,并 计算 yw 与 逐年 产量 Q,(i 二 1,2,…,m) 的 相关 系数 , 当 相 关系 数 达 到 最 大 时 对 应 的 
zo 即 是 给 定 C 条 件 下 x 的 一 个 估计 值 。 

确定 参数 C 的 最 佳 值 。 

在 工 售 计 值 的 基础 上 ,用 和 迭代 的 方法 , 取 C=C 十 kAC(k 二 1,2,… ;0 过 AC 过 1) ,再 利用 
式 (10-8) 计 算 y; 的 值 。 当 y; 与 逐年 产量 Q， 的 相关 系数 为 最 大 时 ,确定 C 的 最 佳 估 计 值 。 

确定 参数 z,C 的 过 程 可 以 反复 进行 ,直到 找到 合适 的 值 为 止 。 

由 确定 参数 4。 


设 Q, 为 逐年 产量 QQ 的 预测 值 , 记 一 2 (QQ; 一 Q.) 全 2 (Q, — Atre') 人 


(t > 0) (J 一 ] ,2,.,m) (10-8) 


dS/dA = 22)(Q— Arre)(— tes)=0 
整理 得 : 


A= PD Qtie® /Dre") (10-9) 

二 、 油田 规模 序列 法 

1. 油田 规模 序列 的 统计 分 布 规律 

油田 规模 是 指 油田 的 最 终 可 采 人 储量。 油田 规模 序列 是 指 对 含油 区 内 已 发 现 的 油田 的 最 
终 可 采 储 量 , 按 从 大 到 小 顺序 排列 成 的 数据 序列 。 

假设 Q.(& 二 1,2,… ,n) 是 某 个 含油 区 内 第 个 油田 的 规模 ,并 且 Q 宇 Q; 宇 … 宇 Q,, 那 
么 国内 外 许多 含油 气 区 的 统计 资料 表明 ,车 以 In Q 和 ln 为 纵横 坐标 作 散 点 图 ,那么 名 
点 大 致 分 布 在 一 条 直线 上 (图 10-1) 。 

王 幼 梅 根据 我 国 含油 气 盆 地 实际 资料 ,在 直角 坐标 系 中 以 油气 田 储 量 和 规模 序号 作 图 
〈1977) ,得 到 主要 含油 气 盆 地 中 油 ( 气 ) 田 规模 分 布 图 (图 10-2) 。 

由 图 10-2 可 以 看 出 ,油田 规模 在 一 定 范围 内 具有 下 列 吞 函 数 关系 ， 
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油田 规模 序列 号 
图 10-1 世界 主要 含油 气 区 的 油田 规模 图 10-2 中 国 主要 会 油 气 盆地 中 油 ( 气 ) 规 模 分 布 图 


Q, = Qn (10-10) 
当 & 一 1 时 ， 
Q. = Qi/7 (2 一 1 ,2 …) 
对 式 (10-10) 两 边 取 对 数 ,得 ， 
lg Q, = lg Q! — klg nn 
令 
7 一 jgQp 一 lgQ,z 一 lg> 
则 有 : 
y= bkzr (‘10-11) 
式 中 zx 一 一 油田 大 小 序号 的 对 数 ， 
& 一 一 直线 的 斜率 ; 
0 一 一 盆地 中 已 发 现 的 最 大 油田 储量 的 对 数 ; 
y- 一 一 规模 序号 为 对 的 油田 储量 的 对 数 。 
式 (10-11) 表 示 对 数 坐 标 系 中 的 一 组 直线 ,这 一 结论 与 世界 油田 规模 分 布 相 一 致 。 
有 研究 指出 ,斜率 上 可 分 为 三 类 :&<1, 有 一 1,k 放 11, 分别 代表 分 散 型 .过 渡 型 和 集中 型 
盆地 油田 资源 量 的 分 布 。 
由 上 述 可 知 , 油 田 规 模 序列 的 统计 分 布 规律 是 :在 双 对 数 坐 标 系 中 ,油田 规模 的 分 布 大 
致 是 条 直线 ,并 在 一 定 范围 内 呈 直 线 递 减 ,直线 段 通 常 包含 了 油 区 90% 以 上 的 储量 ,直线 的 
急剧 下 倾 ,反映 出 油田 规模 随 油田 数目 的 增多 而 迅速 下 降 。 
2， 油田 规模 序列 法 
(1) 齐 波 夫 定律 。 
美国 学 者 齐 波 夫 (Zipf) 于 1949 年 提出 一 个 论断 :把 一 组 离散 型 随机 变量 的 观测 值 按 由 
大 到 小 的 顺序 排列 ,其 结果 是 最 大 的 数值 是 第 二 大 数值 的 两 倍 ,是 第 三 大 数值 的 三 倍 ,以 此 
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类 推 。 这 一 论断 可 表示 为 : 
Qi = 二 nQ; 或 Q,/Q, 一 m/n (10-12) 
式 中 QQ 一 一 序号 为 1 的 随机 变量 的 观测 值 ; 
Q, ,Q, 一 一 序号 为 n,m 的 随机 变量 的 观测 值 ; 
zy72(7 天 加 ) 一 一 随机 变量 观测 值 的 排列 序号 ,可 为 任意 正 整 数 。 

式 (10-12) 称 为 齐 波 夫 定律 。 对 式 (10-12) 两 边 取 对 数 ,整理 得 ， 

(lg Q, 一 lg Q,)/ (lg m— lg n) = 一] (10-13) 

式 (10-13) 指 出 ,在 对 数 坐 标 系 中 作 图 时 ,直线 的 斜率 等 于 一 1。 这 一 结论 表明 ,过渡 型 
盆地 中 油田 规模 序列 服从 齐 波 夫 定 律 。 

(2) 帕 雷 托 定律 。 

帕 雷 托 (Pareto) 于 1927 年 提出 : 

Q,y/Q, = (n/m) (10-14) 
式 中 QQ, 一 一 序号 为 wma 的 随机 变量 的 观测 值 ; 
k 一 一 大 于 0 的 实数 。 

对 式 (10-14) 两 边 求 对 数 ,整理 得 : 

(lg Q, 一 lg Q,)/(lg m— lgn) 一 一 (10-15) 

式 (10-15) 表 明 ,在 双 对 数 坐 标 系 中 , 油田 规模 序列 分 布 在 斜率 为 一 & 的 直线 上 ,这 与 世 
界 主 要 含油 气 区 油田 规模 统计 规律 相符 合 , 即 油田 规模 序列 的 分 布 服从 帕 雷 托 定律 ,而 齐 波 
夫 定 律 是 帕 雷 托 定律 中 《=1 的 特例 。& 亦 可 叫做 油田 规模 分 布 系数 。 

(3) 油田 规模 序列 法 。 

一 个 含油 气 区 内 一 组 油田 的 石油 储量 是 一 组 离散 型 随机 变量 ,它们 的 分 布 规律 服从 帕 
雷 托 定律 。 因 此 ,油田 规模 序列 法 是 根据 油气 区 内 已 发 现 的 油田 储量 ,利用 帕 雷 托 定律 预测 
油 区 内 尚未 发 现 的 油田 储量 (或 资源 量 ) 以 及 全 区 石油 总 储量 的 一 种 油气 资源 估算 方法 。 

3. 方法 使 用 条 件 及 注意 事项 

(1) 方法 使 用 条 件 。 

虽然 世界 上 多 数 铀 气 区 的 油田 规模 序列 在 一 定 程度 上 符合 帕 雷 托 定 律 ,但 到 目前 为 止 
尚 不 能 从 油气 田 形 成 的 地 质 理论 上 圆满 解释 油田 规模 序列 的 地 质 成 因 。 事 实 表明 ,对 于 一 
个 完整 而 独立 的 石油 地 质 体 系 , 油 田 规模 序列 法 的 预测 效果 较 好 。 所 谓 一 个 完整 而 独立 的 
石油 地 质 体系 是 指 该 体系 内 的 油气 生成 . 运 移 .聚集 以 及 其 后 的 地 质变 迁都 是 在 同一 石油 地 
质 演 化 历史 条 件 下 发 生 的 。 简 单 来 说 ,就 是 含油 气 区 内 油田 (或 油 藏 ) 应 具有 统一 的 地 质 成 
因 。 另 外 ,本 方法 适用 于 含油 气 地 区 勘探 的 初期 至 晚期 阶段 。 

(2) 注意 事项 。 

利用 油田 规模 序列 法 预测 未 发 现 油田 时 ,要 注意 含油 气 区 内 油田 的 成 油 期 。 油 田 规模 
分 布 系数 的 不 同 ,反映 了 油田 规模 序列 的 多 样 性 。 因 此 , 当 一 个 大 的 含油 气 地 区 具有 多 期 成 
油 过 程 时 ,就 可 能 存在 多 个 油田 规模 序列 。 在 此 情况 下 ,应 先 把 含油 气 区 内 的 油田 分 类 , 然 
后 按 类 应 用 油田 规模 序列 法 。 

4， 油 田 规模 序列 法 的 计算 过 程 

(1) 排序 及 选择 推算 点 。 

把 油 区 内 已 发 现 的 上 个 油田 , 按 其 储量 由 大 到 小 排序 ,结果 为 Qi (i 二 1,2,…,t)。 选 取 
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Q, 作为 推算 点 (预测 油田 储量 规模 的 基准 点 ) ,并 假设 Qi,QiG 关 1) 在 油田 规模 预测 模型 中 
的 序号 分 别 为 m,n。 

(2) 选择 油田 规模 分 布 系 数 。 

对 于 已 发 现 的 上 个 油田 来 说 , 昌 知 其 规模 序列 的 分 布 基 本 上 服从 帕 雷 托 定 律 ,但 并 不 知 
道 油 田 规模 分 布 系 数 &。 在 此 情况 下 , 先 给 出 & 的 一 个 初 值 ,进行 多 次 油田 规模 序列 的 拟 合 
计算 ,根据 预测 结果 选择 最 终 油 田 规 模 分 布 系数 。 由 于 之 0, 令 k= 二 一 tan 9, 则 x/2<0<x。 
据 统计 , 当 2x/3 夺 09 夺 5x/6 时 ,可 较 快 地 选择 到 上。 记 第 :次 选择 的 & 为 &,。 

《3) 确定 油田 规模 序列 预测 模型 。 

对 于 选 定 的 &,, 骨 进一步 确定 油田 规模 在 预测 模型 中 的 序号 m 和 ,就 可 以 给 出 一 个 相 
应 的 预测 模型 

Q;/Q = (m/n)” 

并 以 此 预测 含油 气 区 油田 规模 序列 。 确 定 mx 和 nn; 的 具体 步 又 如 下 ， 
电 令 4= (QQ 一 3,4， 轧 ， 则 有 





A; = m/n:;, m 一 A,n; 
@ 计算 矩阵 
bu bi bi 
B= bz 机 bz, 
ba bae a Deg 
矩阵 B 中 的 元 素 
及 一 Ar (i= 1,2,.,t;j = 1,2,.,8) 
式 中 1 一 一 使 乘积 Am 最 大 限度 地 接近 咎 阵 B 中 行 号 为 ; 的 正 整数 。 
计算 各 行 的 标准 偏差 
5; 一 Ep B20 (7 = 1,2,." ,8) 


£ 


b, = Db 


i=1} 


当 cv (om EGGi ,一 1,2,… 六 小 于 给 定 的 误差 e 时 ,一 As 即 有 : 
Q;/Q! A (mMm/n) 

此 式 表 明 已 在 允许 的 误差 内 符合 帕 雷 托 定律 , 故 可 把 矩阵 的 第 m 行 作为 含油 气 区 油田 规模 
序列 的 预测 模型 。 

(4) 计算 已 发 现 油田 的 储量 在 油田 规模 序列 预测 模型 中 的 序号 。 

已 发 现 油 田 储量 在 预测 模型 中 的 序号 

1; = bn/A., (1 = 1,2,°,t) 
式 中 ni 一 一 已 发 现 的 第 i 个 油田 的 储量 Q; 在 预测 的 油田 规模 序列 中 的 序号 ; 
bm 一 一 算 阵 B 中 第 m 行 第 j 列 上 的 元 素 。 
(5) 预测 的 最 大 油田 储量 。 
预测 的 最 大 油田 储量 
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即 预 测 的 最 大 油田 储量 为 任 一 个 已 发 现 油田 的 储量 Q; 乘 以 预测 序号 2; 的 &, 次 窗 。 在 已 发 
现 的 所 有 油田 储量 都 可 靠 的 情况 下 , 取 


A 本 
避 = 0 Qnts 
i=} 


为 预测 的 最 大 油田 储量 。 
(6) 计算 油 区 内 预测 的 油田 规模 序列 。 
设 Qu 是 最 小 经 济 油田 的 储量 ,那么 预测 的 油田 规模 序列 


OO =Ou*: =1,2,.,p) 
(7) 预测 油田 规模 序列 的 循环 计算 。 
在 [2x/3,;5x/6] 内 给 9 一 个 增 量 A0, 令 上 ,一 tan(9 十 A0) ,重复 上 述 (3),(4),(5),(6) 步 
的 计算 ,得 到 下 一 个 预测 油田 规模 序列 。 辱 计算 了 ;个 预测 油田 规模 序列 ,那么 选择 标准 偏 
差 


o = [TQ r= 1,2,s) 
i=1 


中 最 小 的 一 个 所 对 应 的 预测 油田 规模 序列 作为 最 终 的 油田 规模 序列 模型 。 

(8) 油 区 石油 总 量 。 

由 最 终 选 定 的 油田 规模 序列 计算 油 区 石油 总 量 

Q&, = > 
这 仅 是 一 个 计算 结果 ,是否 合理 还 应 与 熟悉 油 区 地 质 情况 的 研究 人 员 商 讨 。 

5. 油田 规模 序列 法 的 讨论 性 小 结 

(1) 油田 规模 序列 的 理论 预测 模型 一 一 帕 雷 托 定律 。 

近年 来 ,国内 很 多 研究 和 生产 单位 用 齐 波 夫 定 律 预 测 油田 和 金属 矿床 的 储量 ,有 了 时 效果 
不 佳 , 原 因 在 于 有 的 油田 规模 和 矿床 规模 序列 不 服从 齐 波 夫 定律 。 实 际 上 齐 波 夫 和 定律 仅 是 
帕 雷 托 定 律 中 =1 时 的 特例 ,因此 应 把 帕 雷 托 定律 作为 矿藏 规模 序列 的 理论 预测 模型 。 

(2) 预测 石油 储量 的 可 行 方法 。 

目前 虽 不 能 从 地 质 成 因 理 论 解释 油田 规模 序列 的 分 布 规律 ,但 国内 外 主要 含油 气 区 的 
油田 规模 序列 却 普遍 服从 或 近似 服从 帕 雷 托 定律 。 因 此 ,油田 规模 序列 法 是 一 种 预测 含油 
气 区 尚未 发 现 的 石油 储量 的 可 行 方法 。 

(3) 油田 储量 的 可 靠 性 。 

对 于 已 发 现 的 一 批 油田 ,只 有 其 中 储量 可 靠 的 油田 规模 序列 才 服 从 或 近似 服从 帕 雷 托 
定律 ,所 以 在 利用 油田 规模 序列 法 预测 尚未 发 现 的 石油 资源 量 时 ,注意 不 要 使 用 有 可 能 增加 
储量 或 油田 储量 参数 有 竺 验证 的 油田 数据 ,和 否则 就 不 能 使 用 由 此 得 到 的 油田 规模 序列 的 预 
测 模 型 预测 含油 气 区 中 的 石油 储量 。 

(4) 油田 的 完整 性 和 独立 性 。 

油田 的 合理 划分 是 油田 规模 序列 法 实施 中 的 一 个 重要 环节 。 与 油 藏 的 含义 一 样 ,油田 
也 应 是 一 个 完整 而 独立 的 含油 单元 ,不 能 以 人 为 划分 的 采油 矿区 作为 含油 单元 。 

(5) 独立 的 油田 规模 序列 。 


ee 
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油气 区 存在 不 止 一 个 相互 独立 的 油田 规模 序列 ,此 时 应 把 已 发 现 的 油田 分 解 成 相互 独立 的 
油田 规模 序列 。 

(6) 预测 结果 的 多 解 性 。 

油田 规模 序列 的 预测 模型 随 着 & 的 取 值 而 变化 ,由 此 决定 了 预测 结果 的 多 解 性 。 因 此 ， 
在 系数 & 不 清楚 的 情况 下 ,应 多 次 变换 & 值 ,得 到 一 组 油田 规模 序列 的 预测 模型 ,从 中 选 出 
一 个 使 已 发 现 油田 储量 与 对 应 预测 值 偏 差 最 小 的 预测 模型 ,并 与 熟悉 含油 区 地 质 情况 的 地 
质 工 作者 一 起 分 析 预 测 结果 ,确定 符合 目前 实际 的 预测 结果 。 

三 、 历 史 趋势 外 推 法 

1. 方法 的 基本 思想 

历史 趋势 外 推 法 (经 验 外 推 活 .历史 状态 法 .历史 趋势 法 .特性 曲线 法 ) 是 根据 探 区 内 已 
往 的 油气 勤 探 工作 量 ( 如 勘探 销 井 进 斥 .勘探 井 数 或 勘探 时 间 等 ) 以 及 与 其 相应 的 油气 发 现 
量 ,利用 统计 分 析 方 法 预测 探 区 未 来 油气 发 现 量 的 方法 。 该 方法 由 Davis(1958) 提 出 ,后 来 
美国 学 者 Zopp(1962) ,Hubbert(1967) 等 对 此 方法 
有 所 发 展 。 该 方法 包括 进 尺 发 现 率 法 、. 探 井 发 现 率 发 
法 和 年 发 现 率 法 等 。 这 些 方法 的 基本 思想 是 根据 雪 
蔓 探 工作 量 与 油气 发 现 量 确定 油气 发 现 率 曲线 (图 
10-3) ,并 用 该 曲线 预测 未 来 的 油气 发 现 量 。 

假如 已 往 的 勘探 趋势 和 成 功率 能 持续 下 去 , 则 
可 将 这 类 历史 性 资料 拟 合 成 曲线 进行 外 推 ,以 此 确 
定 末 来 的 资源 发 现 量 。 这 种 方法 主要 适用 于 勘探 勘探 钻井 进 斥 (勘探 井 数 ,…) 
成 熟 区 。 在 没有 重大 意外 事件 打 乱 探 区 发 现 率 总 
趋势 的 情况 下 ,多 年 沿用 这 种 方法 预测 探 区 油气 发 图 10-3 油气 发 现 率 曲线 示意 图 
现 量 是 可 行 的 。 

2. 下 降 曲 线 模 型 

美国 地 质 调查 局 主要 采用 指数 下 降 曲 线 和 双 曲 线 下 降 曲 线 两 个 模型 , 即 


y= Ce 


发 现 率 曲线 


i (10-16) 
式 中 + 一 勘探 工作 其 ( 钉 并 进 尺 、 探 井 井 数 或 时 间 等 ) ; 
y 一 一 油气 体积 
根据 历史 资料 ， 利用 回归 分 析 方法 求 出 式 (10- 16) 中 参数 a 和 5 的 估计 值 后 ,就 可 用 其 
预测 未 来 油气 发 现 量 。 
3. 累计 曲线 模型 
假设 勘探 阶段 工作 量 为 4d, 勘 探 阶 段 数 为 ,那么 指数 下 降 曲线 可 改写 为 ， 
人 
对 上 式 积分 ,得 累计 曲线 模型 
y= [aes™™tD) — ge | /bd (10-17) 
式 中 7 已 进行 过 的 勘探 阶段 数 ，; 
7 一 一 未 来 增加 的 勘探 阶段 数 ; 
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y 一 一 未 来 m 个 勘探 阶段 增加 的 竺 发 现 累 计 痪 源 量 。 
设 已 进行 过 的 7 个 勘探 阶段 增加 的 累计 资源 量 为 v, 那 么 # 十 m 个 勘探 阶段 增加 的 总 累 
计 资 源 量 





一 了 十 y (10-18) 
由 下 降 曲 线 模型 的 性 质 可 知 , 当 mo 时 , 式 (10-17) 的 极限 就 是 最 终 得 发 现 累计 资源 
量 
u 一 一 Ce /bd (10-19) 
最 终 总 累计 资源 量 
Q=vTu (10-20) 


经 济 效 益 是 衡量 油气 勘探 成 效 的 一 个 重要 指标 。 因 此 ,应 该 根据 历史 趋势 外 推 法 预测 
的 未来 油气 资源 量 的 经 济 效益 决定 是 否 进 入 下 一 个 勘探 阶段 。 
S$ 2 含油 气 有 利 地 带 预测 
一 、 地 质 圈 闭 的 模糊 集合 综合 评价 法 
经 过 勘探 发 现 了 一 批 地 质 圈 闭 后 ,人 们 最 关心 的 问题 是 这 些 圈 闭 中 哪些 含油 ,哪些 可 能 
食油 ,哪些 不 售 油 ,这 也 就 是 通常 所 说 的 地 质 圈 闭 的 含油 性 评价 问题 。 这 里 给 出 的 含油 性 概 
念 是 模糊 的 ,因为 不 同 含油 性 的 过 渡 没 有 明显 的 界线 。 对 地 质 圈 闭 的 评价 经 常 是 上 述 模糊 
概念 组 成 的 模糊 集合 。 地 质 学 中 的 一 些 模糊 概念 , 适 于 用 模糊 数学 方法 处 理 。 
应 用 模糊 数学 方法 对 地 质 圈 闭 进行 综合 评价 时 ,应 考虑 以 下 间 题 . 
由 与 地 质 疾 闭 含 油性 有 关 的 多 个 控制 油气 形成 的 地 质 因 素 之 间 , 可 能 存在 多 层次 的 结 
构 关 系 。 例 如 ,地 质 圈 闭 的 含油 性 通常 取决 于 生 油 条 件 .鱼油 条 件 和 盖 层 条 件 等 ,这 些 基本 
条 件 又 由 在 当时 的 勤 探 程度 下 可 能 取得 的 若干 个 次 一 级 的 地 质 因素 构成 ,如 生 油 条 件 可 能 
与 地 质 圈 闭 所 处 的 生 油 条 件 分 区 、 生 油 岩 厚度 、 生 油 岩 的 地 球 化 学 指标 等 因素 有 关 ，。 
地 各 种 地 质 因 素 对 综合 评价 所 起 的 作用 难以 估计 ,多 和 凭 经 验 给 出 ,常用 权重 分 配 表示 。 
模糊 集合 综合 评价 中 的 矩阵 合成 运算 有 多 种 算 子 , 仅 用 一 种 算 子 将 会 丢失 很 多 信 
她 ,从 而 使 评价 结果 过 于 单调 ,甚至 难于 鉴别 地 质 圈 闭 含油 性 的 优 劣 。 
1]. 地 质 圈 闭 综合 评价 的 基本 思想 
探 区 经 过 地 震 勘 探 发 现 了 一 批 地 质 圈 闭 ,钻探 前 要 根据 圈 闭 的 含油 性 对 圈 闭 进行 排队 ， 
从 中 选择 含油 性 好 的 圈 闭 进行 钻探 。 z 
评价 地 质 圈 闭 含油 性 时 , 佑 用 了 ”项 地 质 因素 , 则 构成 2 项 因素 集合 , 记 为 ， 
U = {Ui,U; ,UU,) 
式 中 U;(i 王 1,2,…,n) 是 集合 U 的 元 素 或 子 集 。 当 U; 是 品 的 子 集 时 , 它 可 由 nn 项 元 素 或 
次 一 级 子 集 组 成 , 即 z 
UO 
预想 把 圈 闭 的 含油 性 分 为 m 个 级 别 , 则 可 设 评价 集合 为 : 
V = {Vi, VV,) 
考虑 地 质 因 素 在 评价 地 质 圈 闭 含油 性 时 的 作用 ,假设 因素 集合 U 的 权重 分 配 为 : 
A 一 (4 AAA,) 
式 中 A;(i 二 1,2,…,n) 是 集合 A 的 元 素 或 子 集 。 当 A; 是 A 的 子 集 时 , 它 可 由 n; 项 元 素 或 
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次 一 级 子 集 组 成 , 即 
A, 下 {An ,A 9""" "A ; 


这 里 要 求 A 一 1， 2 As 1，。 


从 U 到 V 的 一 个 模糊 映射 叫 艇 单 因 素 评 价 , 当 U,EU 时 ,有 KC(U;)= (ra yrie 9 srin)o 

对 地 质 圈 闭 含油 性 进行 综合 评价 时 , 若 地 质 因素 既 有 定量 数据 ,又 有 相对 关系 或 定性 描 
述 时 ,一 律 采 用 相对 评语 表示 子 集 RU;) 。 对 于 定量 数据 ,可 通过 等 级 变换 转化 为 相对 评 
语 。 

当 评价 集合 分 为 好 中 、 差 三 个 级 别 时 ,可 按 表 10-1 中 的 评语 级 别 表示 子 集 R(U;)。 与 
此 类 似 , 当 评价 集合 分 为 好 、 较 好 ,中 等 、 较 差 、. 差 五 个 级 别 时 ,可 按 表 10-2 中 的 评语 级 别 表 
示 子 集 RC(U.,)。 

表 10-1 三 个 级 别 的 评语 表 





如 果 U; 是 U 的 元 素 , 则 可 由 个 模糊 映射 RR(U;) 组 成 综合 评价 变换 矩阵 
Tl1 fe "Tim 
Re pe 721 7132 Tam 
rr 
如 朵 UD; 是 U 的 子 集 , 则 可 由 ni 个 模糊 映射 RD ) 二 Cr ,7 ,… ,ry") 组 成 单项 地 质 
因素 的 综合 评价 变换 矩阵 
oy pi 


(1) (27 Cn) 
三 Ti2 rig ri? 
Rk. = (rs ) 。xm 一 

1) (2) 


PR Cm) 
7 in， Yin Pi 


如 果 U; 是 U 的 元 素 ,那么 地 质 因素 的 权重 分 配 A 与 综合 评价 变换 矩阵 RR; 的 合成 B， 





加 十 次 油气 资源 量 及 合 油 气 丰 漠 地 峡 的 预 潮 





B, 二 一 AR， (h = 1 ,2，…， 力 ) (10-21) 
如 果 U, 是 U 的 子 集 ,而 Us; 是 U; 的 元 素 ,那么 首先 计算 次 一 级 地 质 因素 的 综合 评价 
B,; , 即 





Bi =ARs: (hh=1,2,%,p;i = 1,2,",n) (10-22) 
式 中 i 一 一 地 质 因素 的 编号 ; \ 
Ah 一 一 地 质 圈 闭 的 编号 ; 
一 一 答 阵 合成 拭 子 。 


”次 一 级 地 质 因 素 综合 评价 的 计算 结果 应 作为 上 一 一 级 综合 评价 变换 矩阵 的 一 行 。 
最 后 ,可 用 下 式 求 得 每 个 地 质 图 闭 食油 性 的 综合 平 人 全 人 
D 一 BC (下 一 1;2，…， 力 ) (10-23) 
式 中 “C 一 一 等 级 矩阵 的 转 置 矩阵 。 
当 评 价 集合 为 好 、 中 、 差 三 个 级 别 时 ,可 取 等 级 矩阵 为 : 
C= (一 1,0,1) 
求 出 个 地 质 圈 闭 含油 性 的 综合 评价 值 D, 后 ,可 按 D, 的 大 小 将 地 质 圈 闭 按 含油 性 的 
相对 好 坏 进行 排序 ,并 按 该 次 序 销 探 探 区 中 已 发 现 的 地 质 圈 财 。 
2. 矩阵 合成 算 子 
地 质 因素 的 权重 分 配 A 与 综合 评价 矩阵 R 的 合成 称 为 地 质 图 闭 的 综合 评价 B, 即 
AR= B= (6b,b,,b,) 
式 中 的 。 为 矩阵 合成 算 子 ,常用 的 合成 算 子 有 以 下 4 种 ; 
(1) 取 小 取 大 运算 。 
合成 矩阵 B 中 的 元 素 5; 的 计算 方法 为 : 
b=V (ahr) = 12,m) (10-24) 
式 中 人 一 一 在 人 中 取 最 小 值 ; 
V 一 一 在 * 个 最 小 值 中 取 一 个 最 大 值 。 
(2) 乘积 取 大 运算 。 
合成 矩阵 B 中 的 元 素 5; 的 计算 方法 为 : 
pb =V (a er) = 1,2,.,m) (10-25) 
(3) 取 小 求 和 运算 。 
合成 给 阵 B 中 的 元 素 5; 的 计算 方法 为 : 
bj —@B a: A ro) (j = 1,2,° ,m) (10-26) - 


式 中 由 2 个 最 小 值 求 和 。 
(4) 乘积 求 和 运算 。 
合成 矩阵 B 中 的 元 素 5; 的 计算 方法 为 : 


Di 本 (a. . ri ) (J 二 一 1 .2717) (10-27) 





例如 ， 
A=1{0.6,0.3,0.2}, R= |0.4 0.2 0.4 


0.2 0.3 0.5 
0.1 0.6 ot 
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按 取 小 取 大 运算 .乘积 取 大 运算 . 取 小 求 和 运算 .乘积 求 和 运算 的 结果 分 别 为 :(0.3,0. 3， 
0.5),(0.12 ,0, 18,0, 30),(0.6,0,7,1,0),(0.26,0.36,0.48), 

二 、 多 种 信息 重合 评价 法 

多 种 信息 秋 合 评价 法 是 对 探 区 已 有 资料 进行 综合 处 理 的 一 种 方法 。 这 种 综合 处 理 方法 
的 目的 是 想得到 与 含油 气 有 利 地 带 关 系 更 为 密切 的 综合 信息 ,为 制定 探 区 的 勘探 方案 提供 
依据 。 

含油 气 有 利 地 带 的 预测 ,不 应 局 限于 钻探 井 位 的 选择 ,而 且 还 应 该 包 插 全国 范围 内 的 有 
利 含油 气 盆 地 、 盆 地 内 含油 气 有 利 地 质 场 陷 的 挑选 . 场 陷 内 含油 气 有 利 止 陷 或 凸 起 的 确定 、 
凹陷 或 凸 起 内 有 利 圈 闭 的 排队 以 及 圈 闭 上 最 佳 井 位 的 确定 等 一 系列 预测 工作 。 下 面 介 绍 预 
测 含 油气 有 利 地 带 的 多 种 信息 又 合 评价 法 。 

1. 多 种 信息 登 合 评价 法 的 基本 思想 

多 种 信息 至 合 评价 法 的 基本 思想 是 : 先 把 控制 油气 形成 的 各 种 单一 一 地 质 因素 作为 基础 
地 质 信息 ,将 其 绘制 成 基础 地 质 信息 图 ， a in le 图 合 加 得 到 组 合 地 质 
信息 图 ,最 后 将 组 合 地 质 信 息 图 琶 加 生成 综合 地 质 信息 图 。 在 该 图 的 基础 上 ， 进行 综合 地 质 
解释 ,预测 合 油 气 有 利 地 带 ，。 

综 上 所 述 , 多 种 信息 登 合 评价 法 的 基本 思想 可 以 概括 为 图 敬 图 得 新 图 。 新 图 所 包含 
的 信息 是 基础 地 质 信息 经 逐 级 琶 加 而 得 到 的 综合 性 信息 。 

2， 多 种 信息 登 合 评价 法 的 实施 步 又 

(1) 地 质 信 息 的 归 类 与 分 级 。 

整理 收集 到 的 地 质 信息 ,形成 归 类 合理 .层次 分 明 的 信息 体系 ,通常 分 为 两 个 层次 , 即 基 
础 地 质 信 息 和 组 合 地 质 信 息 。 同 类 的 基础 地 质 信 息 构 成 组 合 地 质 信 息 , 组 合 地 质 信 息 蕉 加 
构成 综合 地 质 信 息 。 例 如 在 某 探 区 收集 到 生 油 崖 厚度 、 生 油 宕 有 机 矶 含量 、 储 集 层 厚度 \、 储 
集 层 和 孔隙 度 、 储 集 层 渗透 率 、 盖 层 厚 度 、 局 部 构造 特征 等 共 七 项 与 油气 形成 有 关 的 地 质 信 息 ， 
归 类 后 得 到 如 表 10-3 所 示 的 层次 关系 信息 体系 。 

表 10-3 地 质 信 息 体系 表 


基础 地 质 信息 组 合 地 质 信息 


生 油 岩 厚度 、 生 油 岩 有 机 碳 含量 


储 集 层 厚度 . 储 集 层 孔 际 度 \ 储 集 层 渗透 率 
盖 层 厚度 
局 部 构造 特征 (构造 面积 .闭合 高 度 ) 





(2) 基础 地 质 信息 的 平面 插值 。 

在 基础 地 质 信息 分 布 稀疏 离散 的 情况 下 ,要 对 基础 地 质 信息 进 行 平面 插值 处 理 。 插 值 
的 方法 有 很 多 种 ,可 以 根据 基础 地 质 信 息 的 实际 情况 .选择 合适 的 插值 方法 。 

(3) 生成 基础 地 质 信 息 图 。 

在 地 质 信息 归 类 分 级 和 插值 处 理 的 基础 上 ,生成 统一 比例 尺 的 基础 地 质 信 息 图 。 

(4) 生成 组 合 地 质 信 息 图 。 

把 同类 的 基础 地 质 信息 图 秋 加 ,形成 组 合 地 质 信息 图 。 

(5) 生成 综合 地 质 信 息 图 。 









笋 十 音 油 握 更 温 星 及 合 油 气 有 型 地 带 前 预 油 


把 不 同 的 组 合 地 质 信息 图 从 加 ,形成 综合 地 质 信息 图 。 

3. 地 质 信息 登 合 方法 

多 种 信息 全 合 评价 法 的 实施 步骤 ,是 从 “图 释 图 得 新 图 ”角度 讲 的 。 利用 计算 机 进行 地 
质 信息 羡 合 时 ,是 把 地 质 信息 值 按 某 种 约定 的 算法 琶 加 ,得 到 新 的 地 质 信息 。 下 面 介绍 基础 
地 质 信 息 和 组 合 地 质 信息 的 午 合 方法 。 

(1) 地 质 信息 的 倒 合 前 处 理 。 

@ 地 质 信息 的 正规 化 。 

为 了 保持 各 种 地 质 信息 在 全 合 中 的 等 价 性 及 可 加 性 ,一 般 采 用 极 差 正规 化 方法 ,将 各 种 
基础 地 质 信 息 变 换 到 [0,1j 区 间 内 。 : 

@ 地 质 信 息 的 权 。 

在 进行 释 合 之 前 ,应 当 根 据 各 种 基础 地 质 信息 或 组 合 地 质 信 息 对 油气 形成 所 起 的 作用 ， 
赋 以 合理 的 权 , 以 体现 它们 所 起 作用 的 大 小 。 

(2) 基础 地 质 信息 生 合 方法 。 

基础 地 质 信息 秋 合 方法 是 指 由 基础 地 质 信息 从 合生 成 组 合 地 质 信息 的 方法 ， 

@ 乘积 从 合 。 

这 种 春 合 方法 是 把 平面 上 同一 坐标 点 的 mm 种 基础 地 质 信息 值 进行 加 权 连 乘 ,得 到 该 点 
的 组 合 地 质 信息 值 , 即 








之 | 一 Tz; (J = 1] ,2,* ,te) (10-28) 
式 中 z; 一 一 第 j 种 组 合 地 质 信 息 值 中 的 第 i 种 基础 地 质 信息 值 ; 
z; 一 一 m 种 基础 地 质 信息 值 琶 合 而 成 的 第 i 种 组 合 地 质 信息 值 ; 


ww 一 一 组 合 地 质 信息 种 类 数 ，; 
A; 一 一 第 ; 种 组 合 地 质 信息 中 第 i 种 基础 地 质 信息 值 的 权 。 
在 乘积 琵 合 图 基础 上 对 探 区 进行 分 带 评 价 时 ,分 带 区 间 不 是 等 间距 的 ,区 间 间 隔 值 为 : 
H, = [(r— 1)/k]” (rr 二 1],2,*** ,十 1) 《10-29 ) 
式 中 “五 .一 一 第 -个 分 带 区 间 间 隔 值 ; 
一 一 分 带 区 间 总 数 ; 
7 一 一 琶 合 时 基础 地 质 信息 的 个 数 。 
人 累加 悟 合 。 


这 种 亚 合 方法 是 把 平面 上 同一 坐标 点 的 m 种 基础 地 质 信 息 值 进行 累加 ,得 到 该 点 的 组 
合 地 质 信息 值 , 即 / 


z; 一 Daz CG = 12) (10-30) 
在 累加 合 合 图 基础 上 对 探 区 进行 分 带 评价 时 ,分 带 区 间 是 等 间距 的 ,区 间 间 隔 值 为 : 
H,=[C(r—i)/kj.。m. (r 二 1,2,""* ,二 1) (10-31) 
G) 取 小 全 合 。 
该 方法 是 把 平面 上 同一 坐标 点 的 m 种 基础 地 质 信 息 值 中 的 最 小 值 作为 登 合 值 , 即 
zZ; 一 min 《AR (j= 1,2,." ,1w) (10-32) 


在 取 小 蕉 合 图 基础 上 对 探 区 进行 分 带 评 价 时 ,分 带 区 间 是 等 间距 的 ,区 间 间 隔 值 为 ; 


HH Hr | 
hall ID 
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H,=(—l/k (r=1,2,",k 二 1) (10-33) 
(3) 组 合 地 质 信息 咎 合 方法 。 
组 合 地 质 信 息 又 合 是 指 把 不 同 的 组 合 地 质 信息 个 合 在 一 起 ,生成 综合 地 质 信息 。 如 采 
信息 体系 分 两 个 层次 , 按 上 述 三 种 厂 合 方法 组 合 ,共有 九 种 组 合 地 质 信息 芍 合 方法 。 
Q@ 双重 乘积 硬 合 。 
双重 乘积 二 合法 得 到 的 综合 地 质 信 息 值 为 ; 


2 a = TT TEaszs (10-34) 
式 中 zz 第 ; 种 组 合 地 质 信息 值 ; 
名 一 一 第 7 种 组 合 地 质 信 息 值 的 权 。 
@ 乘积 累加 重合 。 
乘积 累加 全 合法 得 到 的 综合 地 质 信息 值 为 : 


必 一 TTaz -= [Eg; Az : (10-35) 
j=1 eT wit 





@) 乘积 取 小 琶 合 。 
乘积 取 小 至 合法 得 到 的 综合 地 质 信 息 值 为 : 
人 TT&z, 一 T&L min (Aizi) (10-36) 
@ 双重 累加 秋 合 。 
双重 累加 秋 合 法 得 到 的 综合 地 质 信息 值 为 : 


人 (10-37) 
@ 累加 乘积 至 合 。 
累加 屠 积 全 合法 得 到 的 综合 地 质 信息 值 为 : 
me (10-38) 


@ 毗 加 取 小 合 合 。 
累加 取 小 全 合法 得 到 的 综合 地 质 信息 值 为 : 


z 一 Dz = 2 [min Qsza)] (10-39) 
CD) 双重 取 小 登 合 。 
双重 取 小 到 合法 得 到 的 综合 地 质 信息 值 为 : 
z 一 inky Lmin (Apzzi) (10-40) 
@ 取 小 乘积 午 合 。 
取 小 乘积 亚 合 法 得 到 的 综合 地 质 信 息 值 为 : 
z 一 Di 1Tx 这 (10-41) 


外 取 小 累加 重合 。 
BNR 的 综合 地 质 信息 值 为 : 
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z= mink; > Nz (10-42) 
一 1 


L<j<w | 1 


上 面 介 绍 了 多 种 信息 又 合 评价 法 的 基本 思想 、 谷 合 过 程 和 从 合 方法 。 但 是 ,对 不 同 地 质 
信息 进行 巷 合 ,获得 一 个 新 的 综合 地 质 信息 ,这 个 综合 地 质 信息 应 有 明确 的 地 质 含义 ,这 是 
选择 重合 方法 时 应 注意 的 一 个 问题 。 


93 应 用 实例 


【 例 1 前 苏联 罗马 什 金 油田 发 现 于 1948 年 ,其 从 1952 年 投产 到 1979 年 为 止 的 逐年 产 
量 见 表 10-4。 
家 10-4 罗马 什 金 油田 (1952 一 1979) 逐 年 产量 





根据 28 年 的 实际 年 产量 ,按照 确定 参数 的 原则 ,经 计算 得 预测 罗马 什 金 油田 产量 变化 
的 具体 模型 为 
Q, = 6 002. 24t’e™ 
. = (T—1 951)/6.78 Be 
式 中 TT 一 一 预测 年 份 。 
利用 式 (10-43) 预 测 的 罗马 什 金 油 田 逐 年 产量 见 表 10-5, 逐 年 预测 产量 与 逐年 产量 的 
相关 系数 ~ 一 0. 998 4。 产 量 预 测 结果 如 图 10-4 所 示 。 
表 10-5 罗马 什 金 油田 的 预测 的 逐年 产量 


预测 产量 /( X10 +) 预测 年 份 预测 产量 /( X104 4) 预测 年 份 预测 产量 人 (XI104 t) 















五 渔 煞 只 凶 策 


9000 


7200 


S400 


预测 产量 /(x10" t) 


3 600 


1 800 





1 1961 1971 1981 1991 
预测 年 份 
图 10-4 罗马 件 金 油 田产 量 预测 图 
把 zx 一 3, 上 一 (1 979 一 1 951)/6.78 代 人 式 (10-7) ,预测 罗马 什 金 油田 的 最 终 可 采 储 量 为 
>，Q, = 24.988 2 xX 10%. 


【 例 2 了 利用 指数 下 降 曲 线 模型 预测 美国 密 执 安 州 北部 Niagaran 塔 礁 的 将 发 现 资源 量 、 
累计 将 发 现 资源 量 、 累 计 总 发 现 资源 量 。 
表 10-6 中 列 出 了 由 Dan Gill 收集 的 1968 一 1983 年 Niagaran 塔 礁 趋 势 带 历史 资料 的 
外 推 统计 表 。 
表 10-6 Niagaran 塔 礁 趋势 历史 资料 的 外 推 统计 表 


le 指数 下 降 曲 线 模型 
已 钻探 | 发 现 | 累计 | 各 才 
200 7, ; : 1 040. 164 9 
400 4. 1 045.026 7 
600 3 1 048. 325 6 
800 2, 1 050. 564 1 
0 1 1l 052,.083 0 
1 200 1 1 0523. 113 7 
a 0. 1 053.813 1 
1} 600 0, 1 054. 287 6 
] 800 0. 1 054. 609 6 
2 000 0, 1 054. 828 2 





根据 表 10-6 中 已 钻探 井 数 和 发 现 资源 量 数据 进行 回归 分 析 ,确定 指数 下 降 曲 线 模型 y 
一 aee 中 aa 一 510. 300 7,6 二 一 0. 001 939, 即 Niagaran 塔 礁 将 发 现 资源 量 的 指数 下 降 曲 线 预 
测 模型 为 ， 
y = 510. 300 7ereool sz (10-44) 





式 中 3y 一 一 将 发 现 资源 量 ， 
Tz 一 一 今后 钻探 井 数 。 
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预测 结果 见 表 10-6 中 将 发 现 资源 量 、 累 计 将 发 现 资源 量 和 累计 总 发 现 资源 量 。 
【 例 3] 含 油 有 利 圈 闭 的 选择 。 
根据 地 质 调 查 和 地 震 勘探 ,在 某 探 区 发 现 了 5 个 地 质 轿 闭 ( 表 10-7)。 

表 10-7 地 质 圈 闭 各 地 质 因素 的 评语 及 数据 


, 幅度 /m 100 150 90 
件 断层 条 数 0 . 0 1 


由 于 该 探 区 的 勘探 程度 较 低 , 故 生 油 条 件 、 储 油条 件 、 盖 层 条 件 都 是 定性 描述 。 构 造 条 
件 由 地 震 资 料 定 量 描述 。 根 据 现 有 资料 ,确定 5 个 地 质 圈 闭 的 先后 勘探 顺序 。 

(1) 构造 条 件 的 评语 。 

根据 表 10-8 中 规定 的 标准 ,将 表 10-7 中 定量 描述 的 构造 条 件 分 为 5 个 等 级 ,并 转换 为 
评语 描述 ,最 后 得 到 地 质 圈 闭 各 地 质 因素 的 评语 ( 表 10-9)。 





表 10-8 各 构造 因素 评语 分 级 标准 








10 一 30 
100~200 


30 一 50 
200~300 


构造 面积 /mm 
构造 幅度 /m 









表 10-9 地 质 轿 闲 各 地 质 因 素 的 评语 





(2) 地 质 因 素 的 权重 分 配 。 
经 熟悉 资料 的 人 员 分 析 ,确定 各 个 地 质 因 素 的 权重 分 配 如 下 








石油 数学 由 贰 


生 油 条 件 (0. 25) 
储 油 条 件 (0. 25 ) 
盖 层 条 件 (0. 15) 


FR 面积 (0.4) 
pf 加] 幅度 on 
断层 条 数 (0. 3) 
即 两 级 地 质 
= {0.25,0.25,0.15,0.35}, A, = {0.4,0.3,0.3) 
(3) We z 
选用 的 地 质 因素 层次 为 生 油条 件 Ui 、 储 油条 件 U; . 盖 层 条 件 Us .构造 条 件 U4 ,4 项 地 
质 因素 构成 因素 集合 U = {U ,Us ,Us ,U) ,其 中 DiU: ,Us 是 U 的 元 素 ,U, 是 子 集 。 子 集 
U, 由 构造 面积 .构造 幅度 .断层 条 数 这 3 项 次 一 级 地 质 因素 组 成 , 即 U, = {U4 ,Uz ,Uss)。 
因 各 个 地 质 因 素 和 次 一 级 构造 因素 均 划 分 为 5 个 级 别 , 故 构成 5 个 级 别 的 评语 集合 为 Y = 
{Vi Ves Vs} o 
(4) 地 质 圈 闭 排队 。 
@ 构造 条 件 综合 评价 。 
首先 求 次 一 级 构造 因素 , 即 构造 面积 .构造 幅度 、 断 层 条 数 的 综合 评价 。 按 表 10-2 中 的 
5 个 级 别 评语 形成 Ri , 它 是 1 号 圈 闭 第 4 项 地 质 因 素 的 综合 评价 变换 矩阵。 吞 按 梯 积 求 和 
计算 ,1 号 圈 闭 第 4 项 地 质 因素 的 综合 评价 B14 为: 





0.2 0.6 0.2 0 0 
0.2 0.6 0.2 0 0 
0.2 0.6 0.2 0 0 


B, =— AnR,, 一 {10. 4,0, 3,0, 3}° 








= (0.2,0.6,0.2,0,0) 
按 同 样 的 方法 计算 ,得 2,3,4,5 号 图 闭 的 构造 条 件 综合 评价 为 ; 
Bs(tts .025 OB D2 OQ .) 
Bs, = (0,.14, 0.42, 0.14, 0.06, 0.24) 
B,, 一 (0， 0.175, 0.35, 0.235, 0.24) 
Bs, = (0.06, 0.355, 0.41, 0.175, 0 ) 
@ 地 质 圈 闭 综合 评价 。 
进行 地 质 圈 闭 综合 评价 时 ,上 面 计 算得 到 的 Rw 要 作为 综合 评价 矩阵 R 中 的 第 4 行 
若 仍 按 乘 积 求 和 计算 , 则 1 号 圈 闭 的 综合 评价 为 ; 
0.2 0.6 0.2 0 
0.2 0.25 0.5 0.25 
0 0.2 0.6 
0.2 0.6 0.2 0 
一 (0. 12,0.422 5, 0. 275,0. 152 5,0.03) 
按 同样 方法 计算 ,得 2,3,4,5 号 圈 闭 的 综合 评价 为 : 
Bp (0, 0.1857, 0.425， 0.337 5， 0.07 ) 
一 (0.049， 0. 247， 0. 299， 0. 271 ， 0. 134) 


B, = AR = (0.25,0.25,0.15,0.35)° 
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B, = (0， 0.123 75, 0.3275, 0.38475, 0.164) 
Bs = (0.071, 0.33675, 0.318 5, 0.153 75, 0.12 ) 
圈 闭 排队 。 


按 式 (10-23) 计 算 各 地 质 圈 闭 的 综合 译 价值 Di (h 王 1,2,*…' ,5); 
| < 
= 
D, = (0.12,0.422 5,0.275,0. 152 5,0.03)| 0 |=—0.45 
1 
2 
按 同 样 方法 计算 ,得 2,3,4,5 号 图 闭 的 综合 评价 值 为 : 
D, =0.29, D, = 0.194, . D, = 0.589, D, =— 0.085 
根据 圈 闭 综合 评价 值 ,5 个 地 质 圈 闭 编号 排序 为 :4,2,3,5,1, 其 中 4 号 地 质 圈 闭 的 含油 
气 地 质 条 件 最 好 ,1 号 地 质 轿 闭 的 含油 气 地 质 条 件 最 差 , 应 首先 对 4 号 地 质 圈 闭 进一步 勘 
探 。 | 
【 例 4] 含 油气 有 利 地 带 预 测 。 
我 国 北方 某 沉 积 盆地 是 一 个 中 新 生 代 断 陷 倪 地 ,沉积 岩 厚 度 超过 5 000 m, 具 备 形成 油 
气 的 基本 地 质 条 件 。 盆 地 中 的 M 坊 陷 是 最 有 远景 的 含油 地 区 。 为 了 提高 勘探 效益 ,评价 该 
场 陷 内 各 个 地 带 的 含油 气 地 质 条 件 , 并 在 增 陷 内 寻找 最 有 利 的 勘探 地 带 是 十 分 重要 的 。 目 
前 ,勘探 的 主要 目的 层 系 是 & 系 户 组 , 销 探 工作 主要 集中 在 增 陷 的 东部 地 区 ,全 增 陷 已 基本 
完成 地 震 甚 探 ， 因 此 ,用 多 种 信息 至 合 法 进行 评价 时 ,是 以 地 震 勤 探 资 料 为 主 , 结 合 钻井 资 
料 ,对 全 增 陷 进行 有 利 勘探 地 带 的 预测 
评价 中 选择 生 油 宕 厚度 、TTI 值 , 生 油 岩 沉 积 相 等 共 10 项 基础 地 质 信 息 ( 表 10-10) ,由 
它们 又 合成 生 油条 件 、 储 油条 件 ,构造 条 件 、 含 油气 状况 和 盖 屋 条 件 共 5 项 与 油气 形成 有 关 
的 组 合 地 质 信息 ( 表 10-10) ,组 合 地 质 信息 的 再 次 到 加 形成 最 终 的 综合 地 质 信息 ,其 炙 合 过 
程 如 图 10-5 所 示 。 
表 10-10 M 雹 陷 的 地 质 信息 及 分 类 标准 
组 合 地 质 信息 基础 地 质 信 息 
生 油 岩 厚度 /m 300~ 500 >500 
生 油条 件 ”TTI 值 | >256 . 8 一 256 
生 油 岩 沉积 相 浅 测 


| 

泪 
Lil 
注 


级 
<8 
他 
储 集 层 厚 度 /m 100 一 300 >300 

储 油条 件 
储 集 层 沉 积 相 沼 河流 平原 浊 积 鹿 三 角 洲 
构造 面积 /km <20 20 一 35 >35 
干 井 


构造 条 件 构造 幅度 /m < | 100~150 >150 


构造 类 型 断 块 , 岩 性 。 “| 断 粤 . 半 青 斜 . 潜 山 背 锋 
含油 气 状况 油气 产 状 | 和 干 并 ”| ”油气 显示 油气 流 
盖 屋 条 件 盖 层 厚度 /mm >2 400 1 200~2 400 









宣 溢 数字 地 中 


生 油 岩 厚度 生 油 条 件 


生 油 岩 沉积 相 


储 集 层 厚 度 


储 集 层 沉积 相 多 种 信息 又 合 评价 


构造 面积 
构造 幅度 
构造 类 型 


油气 产 状 





盖 层 摩 度 


图 10-5 “多 种 地 质 信 息 释 合 过 程 示意 图 

根据 地 震 、 钻 井 资料 在 该 坊 陷 内 发 现 了 76 个 局 部 构造 。 把 所 选 的 10 项 基础 地 质 信息 
按 统一 标准 划分 为 三 个 等 级 ,给 出 分 级 标准 与 地 质 信 息 间 的 关系 ( 表 10-10)。 在 三 个 级 别 
中 三 级 的 含油 气 条 件 最 好 ,一 级 最 差 。 

为 了 便于 计算 ,将 基础 地 质 信息 按 一 、 二 ,三 级 分 别 赋值 为 1,2,3。 按 分 级 标准 ,形成 均 
陷 76 个 局 部 构造 的 原始 地 质 信息 。 原 始 地 质 信息 的 坐标 均 以 原 图 的 左下 角 为 坐标 原点 ,各 
点 的 坐标 值 是 在 原 图 上 以 cm 为 单位 的 实测 值 。 

根据 盖 合 选用 的 计算 参数 ( 表 10-11), 由 10 项 基础 地 质 信 息 琶 合 得 到 生 油 条 件 、 储 油 
条 件 、 构 造 条件 、 含 油气 状况 和 盖 层 条 件 5 张 组 全 地质 信息 评价 图 ,最 后 由 这 5 张 组 合 地 质 
信息 评价 图 释 合 得 到 综合 地 质 信 息 评价 图 (图 10-6) 。 


一 一 国 国 所 有 利 地 以 
EI] 肥 利 地 区 
[J 中 等 地 区 
EEE 梧 不 利 地 区 
[| 最 不 利 地 区 





图 10-6 综合 地 质 信息 评价 图 





部 十 评 油气 资 温 硬 及 全 油气 在 币 地 前 傍 预 测 





表 10-11 有 关 的 重合 计算 参数 


基础 地 质 “| 基础 地 质 | 人 jy | 基础 地 质 | 基础 地 质 信 | 组 合 地 质 ee 组 合 地 质 | 组 合 玖 
信息 名 称 | 信息 个 数 信息 权 | 息 辣 合 方法 | 信息 名 称 质 信息 人 信息 权 | 合 方法 





生 油 岩 厚度 内 
es Gs 于 累加 
盖 层 厚度 圆 内 





这 些 评价 图 都 划分 为 会 油气 最 有 利 地 区 、 有 利 地 区 中 等 地 区 ,不 利 地 区 和 最 不 利 地 区 
共 5 个 级 别 。 在 此 基础 上 , 选 出 21 个 含油 气 地 质 条 件 较 好 的 局 部 构造 ,其 中 4 个 局 部 构造 
经 锁 探 证 实 为 含油 构造 。 后 期 勘探 证 实 , 在 图 10-6 东部 的 最 有 利 地 区 ,建成 了 具有 一 定 规 
模 油 气 产能 的 油田 。 


思考 与 练习 
0 A 
么 是 生命 旋回 、 生 命 量 和 生命 总 量 ? 
是 齐 波 夫 定 律 ? 什么 是 帕 雷 托 定律 ? 
. 什么 是 油田 规模 ? 
. 用 齐 波 夫 定 律 或 帕 雷 托 定 律 预测 油田 规模 时 应 注意 哪些 条 件 ? 
.模糊 数学 方法 为 何 适 于 对 地 质 圈 闭 的 含油 气 性 进行 综合 评价 ? 
A oR 
.多 种 信息 又 合 评价 法 的 要 点 是 什么 ? 
. 熟悉 多 种 信息 否 合 评价 法 的 实施 步骤 。 
10. 信息 警 会 中 应 注意 哪些 问题 ? 


OO 
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第 十 一 章 ”模糊 数学 方法 及 其 应 用 


模糊 数学 是 用 数学 方法 研究 和 和 处理“ 模糊 性 ”现象 的 数学 。 所 谓 的 模糊 性 主要 是 指 客观 
事物 差异 中 间 过 渡 界 线 的 “不 分 明 狂 ”, 如 储 层 的 食油 气 性 、 油 田 规模 的 大 小 、 成 油 地 质 条 件 
的 优 劣 . 圈 闭 的 形态 、 岩 石 的 颜色 等 。 由 于 事物 间 差 异 的 模糊 性 ,因此 描述 它们 特征 的 变量 
也 是 模糊 的 , 即 各 变量 的 内 部 分 级 没有 明显 的 界线 。 地 质 作用 是 复杂 的 ,对 其 产生 的 地 质 现 
象 有 些 可 以 采用 定量 的 方法 来 度量 ,有 些 则 不 能 用 定量 的 数值 来 表达 ,而 只 能 用 客观 模糊 或 
主观 模糊 的 准则 进行 推断 或 识别 。1965 年 美国 控制 论 专 家 Zadeh 提出 模糊 数学 的 概念 后 ， 
模糊 数学 得 到 了 迅速 发 展 并 逐渐 应 用 到 各 个 领域 ,在 地 质 学 中 主要 用 于 矿产 资源 评价 ,各 种 

地 质 现象 的 分 类 .识别 .决策 和 模拟 。 在 此 介绍 油气 勘探 中 常用 的 模糊 聚 类 分 析 和 模糊 模型 
识别 。 
81 模糊 聚 类 分 析 

模糊 聚 类 分 析 是 在 模糊 相似 和 矩阵 的 基础 上 ,对 分 类 对 象 进 行 定 量 分 类 的 方法 。 它 的 主 
要 内 容 包括 数据 的 标准 化 .建立 模糊 相似 矩阵 和 动态 聚 类 三 部 分 。 

一 、 数 据 标 准 化 

1， 原始 数据 


假设 有 个 被 分 类 对 象 , 每 个 对 和 象 又 有 mm 个 描述 对 象 特性 的 变量 ,它们 的 观测 值 构 成 
的 原始 数据 矩阵 为 : 


之 11 Xl? Tlm 
X21 X22 TL2m 
入 一 电 

Tn Tn Tm 
2， 极 差 正 规 化 
极 差 是 变量 观测 值 的 最 大 值 与 最 小 值 之 差 , 即 

AZi 一 maxzrs — minz, (7 = 1,2,,7m) 
Ee ee 变换 公式 为 : 
ry= (rs minze)/Azy (i=1,2,n3j = 1,2,.%,m) (11-1) 


式 中 ee 
正规 化 前 的 数据 (原始 数据 ); 
minxs ;一 一 第 7 个 变量 观测 值 的 最 小 值 。 


由 式 (11- 1) 可 知 , 对 原始 数据 进行 正规 化 处 理 后 ,新 数据 的 最 大 值 为 1, 上 且 z', 之 0, 即 新 
数据 分 布 在 区 间 [o,1] 内 。 

二 、 模糊 相似 矩阵 

We i i 用 于 样品 模糊 豪 类 和 变量 模糊 聚 类 的 模糊 相似 
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站 1 f 
rl] 7 12 A rln rT 11 rT 12 "rn 
扩 r r r 六 六 
21 22 ps 2n / 21 2? 2 
R= R’ = | 
1 f 产 
nl rn2 ee 7 mr r nl r 72 r mm 


模糊 相似 矩阵 中 的 元 素 是 衡量 分 类 对 象 之 间 模 糊 相 似 程度 的 指标 ,两 种 元 素 的 计算 方 
法 类 似 。 因 此 ,下 面 仅 介绍 对 样品 进行 模糊 聚 类 时 ,建立 模糊 相似 矩阵 的 常用 方法 ,读者 仿 
照 这 些 方法 容易 写 出 对 变量 进行 模糊 聚 类 时 ,建立 模糊 相似 矩阵 的 方法 。 为 书写 方便 ,在 建 
立 模糊 相似 矩阵 的 各 种 方法 中 , 仍 用 zj; 表示 正规 化 后 的 数据 人 

1， 相似 系 数 法 : : 

(1) 数量 积 法 。 


1 2 一 7 
ry = = 2, ,1) (11-2) 
| 1 z 天 J/ 
太 二 1 


式 中 M 一 max( D2) Tarn)。 
371 k=l 
显然 ,|r; | EL0,1j]。 若 二 0, 令 rs = (7; 十 1)/2, 则 ey rj 的 大 小 指出 分 类 


对 象 i 和 j 模糊 相似 程度 。 
(2) 最 大 最 小 法 。 


ry = Dra Aza)f PD ra Vr) Cj=1,2" 0) (11-3) 
式 中 人 一 一 在 za ,zn 两 个 元 素 中 取 一 小 值 ; 
V 一 一 在 咏 沁 3 二 计 两 个 元 率 中 取 一 大 值 。 
(3) 算术 平均 最 小 法 。 


人 zn) > Cra 十 xx] 一 12 0) (11-4) 

(4) 几何 平均 最 小 法 。 
ri 一 pe 人 ey VT 工交 (2,7 = ] ,2 ，…y 711) (11-5) 
k=1 k= ; 
在 式 (11-3),(11-4),(11-5) 中 ,要 求 x ,zn 都 大 于 0, 否则 要 对 数据 进行 适当 变换 。 显 
然 rs EL0,1]. 

(5) 夹 角 余弦 和 相关 系数 法 ， 
参见 第 四 章 。 
2. 距离 系数 法 
(1) 绝对 值 倒数 法 。 


1l 2 三 7/ 
ry 一 a (7,7 = 1 ,2 ,7n) ‘11-6) 
1 [zs—zxx| i 
k=1 
适当 选取 M, 使 得 Or 二 1, 
(2) 切 比 轨 夫 距 离 法 。 
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dy =V | 站 一 大 | (ij = 1,2,°,n) (11-7) 

(3) 欧 氏 距离 法 。 

参见 第 四 章 。 

三 、 模 糊 聚 类 

1， 模 糊 等 价 矩 阵 

设 论 域 品 = {zx} 是 分 类 对 象 的 一 个 集合 。 给 定 吕 上 的 一 个 模糊 相似 矩阵 RR, 如 果 它 满 
是 目 反 性 Cy; 二 1) 、 对 称 性 (rs 二 ry) 和 传递 性 (RRSER) ; 则 称 R 是 U 上 的 一 个 模糊 等 价 和 矩 
阵 。 

这 里 的 符号 “” 表 示 和 矩阵 的 合成 运算 ,类 似 矩 阵 乘 法 运算 ,但 要 将 元 素 的 相 滋 改 为 取 小 
值 , 相 加 改 为 取 大 值 。 

”用 相似 系数 法 和 距离 系数 法 得 到 的 模糊 相似 矩阵 满足 自 反 性 和 对 称 性 ,但 不 一 定 满足 
传递 性 ， 告 模糊 相似 矩阵 不 满足 传递 性 , 则 可 先 计算 ReR( 记 做 R*), 然后 查看 R* 是 否 满足 
传递 性 ,车 不 满足 ,再 经 过 RoRi… 运算 ,总 可 将 R 改造 为 满足 传递 性 的 模糊 等 价 和 矩阵 。 

2. 模糊 等 价 矩 阵 的 截 给 阵 
设 民 是 个 模糊 等 价 矩 阵 ,对 于 任意 的 EL0,1], 称 尺 为 R 的 4 截 矩 阵 。 玉 中 的 元 素 
l ry 之 4 
人 (1,7 = 1,2,.,n) 
0 ri 之 A 
式 中 4 一 一 阅 值 。 
3. 动态 聚 类 
由 R 可 知 , 当 x 六 二 1 时 ,描述 分 类 对 象 i 与 i 的 模糊 变量 的 观测 值 最 接近 , 即 i 与 ; 之 
间 的 差 蜡 最 小 ,应 归 为 同一 类 ,否则 为 不 同 的 类 。 让 4 由 大 到 小 变化 ,可 形成 动态 聚 类 图 。 
四 、 最 佳 阐 值 的 确定 
在 模糊 等 价 关 系 的 模糊 豪 类 中 ,对 于 不 同 的 A4E[0,1], 可 得 到 不 同 的 分 类 方案 ,从 而 形 
成 一 种 动态 聚 类 图 ,这 对 全 面 了 解 对 象 的 分 类 情况 是 比较 形象 和 直观 的 。 但 有 的 实际 问题 
需要 选择 茶 个 恰当 的 1, 确定 一 个 具体 的 分 类 方案 ,这 就 是 确定 闭 值 的 问题 。 
1. 按 实 际 需 要 确定 
在 动态 聚 类 中 ,调整 4 的 值 可 以 得 到 不 同 的 分 类 ,从 中 选择 一 种 合适 的 分 类 方案 。 另 
外 ,也 可 由 熟悉 专业 的 专家 确定 阅 值 4， 得 到 给 定 贱 值 水 平 下 的 分 类 。 
2 用 下 统计 量 确定 4 的 最 佳 值 
设 对 应 于 4 的 分 类 数 为 r ,第 7 类 的 对 象 数 为 n; ,其 样本 记 为 x 人 ?x ，… i ,第 7 类 的 
聚 类 中 心 为 向 量 x7 一 (zi ,xz 刀 xz2)。 定 义 统计 量 


Dn lx? —xl /rr— 1) 
j=1 


EE 
式 中 有 第 J 类 中 各 变量 的 平均 值 ， 即 x = (zo yy ,a "TD ); 


po 





TX) 





第 j 类 中 第 个 变量 的 平均 值 , 即 2? 一 上 了 zp Ck 一 11,2) ， 
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x 一 一 样品 变量 的 平均 值 , 即 X 一 (XI Wy 9 ,Xn ); 
过 ”第 不 个 变量 全 部 观测 值 的 平均 值 , 即 xz 一 ~ Dralh EE 





| xl 


xz 与 广 距 离 的 平方 , 即 ‖ 72 一 这 1 一 D(z 一 X41)?， 
=] 





Lx x | 


x 与 x 距离 的 平方 , 即 上 x? 一 x 二 2 一 2。 
k= 1 


下 服从 第 一 自由 度 为 > 一 1, 第 二 自由 度 为 2 一 "的 分布。 它 的 分 子 是 类 与 类 之 间 的 
距离 ,分 母 是 类 内 样品 间 的 距离 。 正 越 大 ,表明 类 与 类 之 间 样 品 的 差异 越 大 , 即 分 类 效 采 越 
好 。 

假设 各 类 差异 不 明显 ,对 于 给 定 的 检验 水 平 a, 查 F,(r 一 1,n 一 7) 分 布 表 得 临界 值 F ,者 
FF 二 F,, 则 认为 各 类 之 间 有 明显 的 差异 ,否则 应 重新 选择 阐 值 。 
8$ 2 模糊 模型 识别 

模糊 模型 识别 是 已 知 论 域 U 上 有 7 个 标准 模糊 模型 ,确定 一 个 或 一 批 待 识别 的 模糊 对 
象 属于 哪个 标准 模糊 模型 , 即 对 待 识 别 对 象 的 归属 做 出 判定 。 地 质 学 领域 中 有 很 多 属于 模 
精 模 型 识别 的 问题 ,如 在 储 层 含 油气 性 这 一 论 域 上 ,有 油层 .油气 层 . 油 水 同 层 . 气 层 、 含 水 油 
层 . 干 层 等 标准 模糊 模型 ,判断 钻 穿 储 层 的 含油 气 性 就 是 一 个 对 标准 模糊 模型 的 识别 问题 。 
为 解决 此 类 问题 ,必须 构造 一 种 衡量 待 识别 的 模糊 对 象 与 标准 模糊 模型 之 间 模 糊 性 程度 的 
度量 。 在 模糊 模型 识别 中 ,常用 的 模糊 性 度量 有 素 属 度 和 贴近 上 度 。 

一 、 隶 属 度 

1， 模糊 向 量 及 其 内 外 积 

若 0 和 us 委 10G 一 1,2, 7) , 则 称 V== 《os,vs，…,v,) 为 模糊 向 量 ( 模 糊 模 型 )。 若 X,Y 
是 模糊 向 量 , 则 称 式 (11-8) 和 式 (11-9) 分 别 为 下 与 了 的 内 积 和 外 积 。 


XY 一 V (zi A yi) (11-8) 


XxY 一 人 (zi V y) (1-9) 
2， 模 糊 模 型 库 
设 是 | ,大 2 "°° ， 是 论 域 U= (Zi sto 9"*" ,Xm} 上 的 天 个 标准 模糊 模型 ; 则 称 六 二 (六) 从? 9” 
… ,XX, ) 为 模糊 模型 库 ，。 
3. 隶属 度 i 
设 光 二 (六 ， ;人 ,XX,) 为 模糊 模型 库 , 各 模型 的 隶属 函数 为 X;(z) (i 二 1,2,…,n), 而 
xz 一 (zi , 友 ，…，zo) 为 普通 向 量 时 ,定义 
Kix) 一 A [Xe i=1,2.0n) (11-10) 
为 Xe 对 XX， 的 隶属 度 。 
隶属 度 适 用 于 待 识别 对 象 是 单 因 素 的 情形 。 用 隶属 度 确 定 待 识别 对 象 的 归属 ,关键 是 
建立 符合 实际 的 隶属 函数 ,但 这 是 目前 尚未 完全 解决 的 问题 。 我 国学 者 汪 培 庄 提出 的 随机 
集落 影 理 论 对 于 相当 一 部 分 模糊 集 的 隶属 函数 的 客观 实在 性 给 出 了 满意 的 解释 ,基于 这 一 
理论 的 模糊 统计 方法 是 确定 一 类 模糊 集 隶 属 度 的 有 效 方法 。 目 前 确定 隶属 函数 的 方法 有 模 


ee 


百 油 数学 地 后 





糊 统计 法 .指派 法 .借用 已 有 尺度 法 等 。 
4, 最 大 隶属 度 原则 


原则 1]. 设 论 域 US= {ZI ”Toyo Tm } 上 的 模糊 模型 库 为 入 一 (XI ， ;六 ,) , 若 对 任意 
XU, 有 上 EE(Q,2,…,n) ,使 得 
a 一 V Xi(z) (11-11) 
成 立 , 则 认为 ze 相对 隶属 于 %,。 
【 例 1 了 学习 成 绩 等 级 判断 。 


在 学 习 成 绩 LU 一 


{0,100} 这 一 论 域 上 确定 三 个 表示 学 习 成 绩 的 模糊 模型 A 二 “ 优 ”,8== 


“ 良 ”,C 一 中”。 当 一 位 学 生 的 数学 成 绩 为 88 分 时 ,应 该 评 为 哪个 等 级 ? 
解 : 用 指派 法 建立 论 域 口 =10,100) 上 A,B,C 的 隶属 郴 数 : 


0 
A(x) = 1- 80)/10 
] 


0 

(zxz—70)/10 
Bl(r)=/! 

《95 — x)/10 

0 


0 
C(x) = le — Xx)/10 
1 
将 z= 二 88 代入 隶属 函数 计算 ,得 
度 原 则 工 , 该 同学 的 成 绩 应 评 为 优 。 
原则 卫 ; 设 论 域 CU 一 (zyzz，… 
EU 。 如 果 有 某 个 必 满足 


Alzs) =V [ACzi)] 


则 Tk 与 模型 A 最 相似 。 
〖 例 2 择优 录用 。 


0 委 工 过 80 


80< 工 生 90 


90 一 工 过 100 
0 委 工 过 70 

70 过 rz 志 80 
80 一 zx 二 85 
85 一 xz 二 95 
95 一 zx 去 100 
0 三 工 世 70 

170<< 生 80 
80 二 zx 100 


A(88)=0,8,B(88)=0.7, C88) 二 0 根据 最 大 隶属 


sn } 上 有 一 个 标准 模型 和 ,得 识别 对 象 有 192 9 9 Tm 


(11-12) 


设 三 名 学 生 英 语 学 习 成 绩 论 域 U= {zi ,xz ,zs}， 在 U 上 确定 一 个 模糊 模型 4 二 “ 优 ”。 
若 三 名 学 生 的 成 绩 分 别 为 zi 二 70,zs 一 84,z; 一 90, 那 么 ,根据 英语 成 绩 哪 位 学 生 应 优先 留 


校 任教 。 


解 :分别 将 他 们 的 英语 学 习 成 绩 代 入 模糊 模型 隶属 函数 


0Q 
A(z) = 人 一 :80)710 


l 


0 委 工 所 80 
80 二 I 工 夺 90 
90 过 xX 革 100 


计算 得 到 A(70) 一 0 ,A(84) 二 0.4,A(90)= 二 1。 根据 最 大 隶属 度 原则 开 ,英语 成 绩 为 90 


a 
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二 、 贴 近 度 
1， 贴近 度 的 一 般 定 义 

设 4,B 是 论 域 U 上 的 两 个 模糊 模型 , 则 称 

oo(A,B) = [AB+ (1—Ax*B)|/2 l. (11-13) 

为 B 与 4 的 贴近 度 , 其 中 B 是 被 识别 对 象 。 

贴近 度 是 描述 模糊 模型 之 间 彼 此 人 靠近 程度 的 指标 ,由 我 国学 者 汪 培 庄 握 出。 由 于 人 研究 
的 问题 不 同 ,贴近 度 也 有 不 同 的 定义 形式 。 

贴近 度 适用 于 模糊 模型 库 , 待 识别 对 象 可 以 是 模糊 模型 或 普通 模型 ,模糊 模型 库 中 的 每 
个 模糊 模型 和 待 识别 对 象 均 有 m 个 相同 的 特性 变量 。 设 和 X,(i 二 1,2,…,n) 和 YY 分别 是 论 域 
U 上 模糊 模型 库 中 的 模糊 模型 和 待 识别 对 象 ,大 把 XX;,Y 视 为 论 域 U 上 的 点 ,那么 ,贴近 上 度 
越 大 ,Y 与 和 X; 的 距离 就 越 小 , 即 待 识别 对 象 与 模糊 模型 的 特性 越 相 似 。 因 此 ,可 根据 贴近 度 
的 相对 大 小 对 Y 进行 归 类 。 选 择 某 种 计算 贴近 度 的 方法 ,计算 Y 与 XX; 的 贴近 度 , 记 为 
oo (X,Y) (i 二 1,2,…,n), 寿 其 中 的 最 大 者 为 oo(X,Y 了 ), 则 认为 Y 与 XX 同类 。 : 

2. 择 近 原则 

设 论 域 U 上 的 模糊 模型 库 为 针 二 (KX ,X,Y 为 U 上 的 待 识别 对 象 , 若 存在 kE 
(1 ,2,…,n) ,使 得 


Go (RX ,Y) =V, To (X, 人 (11-14) 
则 竺 识别 对 象 归 人 X 类 。 
3. 实用 贴近 度 
在 实际 工作 中 稼 用 的 几 个 计算 贴近 度 的 公式 如 下 : 


二 一 1 一 
下 一 了 下 一 1】 


om(4,B) Al 一 二 > |[ACzo) 一 BCzo)]| 
中 一 】 


1 
93 应 用 实例 

【 例 1] 预 测 含油 气 有 利 地 区 ，。 

为 了 寻找 含油 气 有 利 的 勘探 地 区 ,选择 了 8 个 生 油 指标 和 5 个 其 他 指标 作为 胜利 油田 
18 个 尘 陷 的 评价 指标 ( 表 11-1, 据 诸 克 军 ) ,各 指标 的 数据 由 专家 组 根据 已 有 的 勘探 资料 综 
合 评分 给 定 ,满分 为 10 分 。 已 知 利津 洼 陷 是 18 个 洼 陷 中 勘探 程度 最 高 .含油 气 性 最 好 的 注 
陷 。 

在 对 表 11-1 中 数据 进行 极 差 标准 化 的 基础 上 ,利用 夹 角 余弦 法 计算 相似 矩阵 ,再 利用 
传递 财 包 法 求 模 糊 等 价 和 矩阵, 对 于 给 定 的 EL0,1], 得 到 模糊 聚 类 动态 聚 类 图 (图 11-1)， 
奉 以 相似 程度 0. 75 为 标准 ,18 个 洼 陷 明显 地 分 为 两 类 。 根 据 动 态 聚 类 过 程 , 得 到 第 一 类 浩 
陷 的 先后 勘探 排序 ( 表 11-2) 。 对 于 第 二 类 洼 陷 , 根 据 已 有 的 勘探 资料 ,同样 可 以 得 出 先后 
勤 探 顺序 。 渤 陷 的 勘探 排序 可 为 石油 勘探 决策 提供 依据 。 
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表 11-1 


下 ea CD 





条 冰 长 区 年 培 证 区 东 由 这 加 证 各 错 革 相当 
去 名 斗 也 二 风 属 姐 谋 儿 长 由 直接 区 到 需 几 


五 束 数 字 地 贰 
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表 11-2 第 一 类 有 利 勘 探 洼 陷 排序 表 
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【 例 2] 气 测 井 资料 识别 储 层 含油 气 性 。 

设 论 域 口 = { 储 层 含油 气 性 } 上 有 油层 、 油 水 同 层 ,含油 水 层 . 干 层 等 模糊 模型 ,得 识别 含 
油气 性 的 储 层 为 模糊 模型 了 Y, 试 根据 贴近 度 判 定 Y 的 含油 气 性 ，。 

(1) 建立 标准 模糊 模型 库 。 

在 试 油 证 实 的 油层 .油水 同 层 .含油 水 层 . 干 层 内 各 取 符 干 个 样品 ,每 个 样品 都 有 相同 的 
气 测 指标 ,它们 都 是 模糊 变量 。 把 各 类 样品 气 测 指标 的 平均 值 作为 标准 模糊 模型 ,由 它们 构 
成 标准 模糊 模型 库 ( 表 11-3)。 

表 11-3 储 层 含油 气 性 标准 模型 数据 





指标 平均 值 
模型 库 的 标准 模型 
Tl X2 Xs I4 5 rs 工 ? 
油层 (CX) 
油水 同 层 (X,) 
含油 水 层 (X;) 
干 层 (XX4) 





表 11-3 中 ,zz 为 气 测 指 标 zx;(i 一 1,2,… ,7) 的 平均 值 , 它 是 用 逐步 判别 分 析 方 法 从 数 项 
气 测 综合 指标 中 筛选 出 的 识别 能 力 强 的 综合 指标 ,其 定义 为 ， 
Ti 一 ca/3l 
Z2 = Cs/s1 
23 = icy/c 
Wp 
i 
| Cs/s2 
Xx? 一 [58(ic 十 Me) 十 72cs]/(44ci ) 
1 一 CC 十 cs 十 cs 十 2 十 ?cs 
52 一 5C? 十 cs 十 zs 十?Hc4 十 cs 
《2) 对 待 识 别 储 层 含油 气 性 进行 识别 。 
计算 得 识别 储 层 Y 与 X;(i 二 1,2,3,4) 的 贴近 度 oo (Xi,Y)(G 一 1,2,3,4) , 若 m(X ,7Y) 是 
其 中 的 最 大 者 (aE (1,2,3,4)), 则 认为 待 识别 储 层 Y 的 含油 性 与 入 . 相同 。 部 分 储 层 样品 识 
别 效果 见 表 11-4。 
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表 11-4 某 地 区 馈 层 含油 气 性 模式 识别 与 试 油 结果 


油水 同 层 





思考 与 练习 

么 是 模糊 数学 ? 它 的 研究 对 象 是 什么 ? 
么 是 模糊 相似 矩阵 和 模糊 等 价 和 矩阵 ? 
么 是 模糊 矩阵 的 4 截 矩 阵 ? 如 何 利 用 它 进行 动态 聚 类 ? 
什么 是 隶属 度 和 贴近 度 ? 它们 的 人 铭 义 是 什么 ? 
何谓 模糊 模式 识别 ? 用 其 可 以 研究 地 学 中 的 哪些 问题 ? 
. 熟 芒 模糊 相似 矩阵 和 隶属 度 、 贴 近 度 的 计算 方法 。 
. 茶叶 等 级 的 识别 。 

设 论 域 U= (茶叶 } ,茶叶 等 级 标准 模型 为 多; ， 慎 ; , 夺 ,XXX, 待 识别 的 茶叶 祥 品 为 了 ， 
衡量 茶叶 质量 的 指标 为 条 索 、 双 泽 、 净 度 .汤色 .香气 和 滋味 。 茶 叶 等 级 标准 模型 与 祥 品 的 有 
关 数 据 见 表 11-5。 


二: 二 
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表 11-5 茶叶 标准 模型 与 样品 数据 


茶叶 标准 模型 
| 





oo (X,Y) = 5[XY + (1 — X,*Y)] (一 1 2 5) 


计算 茶叶 样品 Y 与 模型 大,( 一 1,2,…，,5) 的 贴近 度 , 并 按 择 近 原则 确定 茶叶 样品 下 的 等 级 。 
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91 随机 场 与 区 域 化 变量 


一 、 随 机 函数 和 随机 场 

者 只 能 知道 某 变量 的 取 值 范围 ,而 不 能 预测 它 取 何 值 , 则 称 这 种 变量 为 随机 变量 ,如 地 
层 水 的 矿 化 度 、 储 层 的 孔 际 度 和 渗透 率 等 。 在 实际 中 经 常 碰 到 观测 结果 是 依赖 于 时 间 参 数 
t 的 函数 ,并 且 在 相同 条 件 下 重复 观测 时 ,函数 的 形式 也 不 一 样 , 如 在 相同 震源 下 ,地 震 记 录 
的 振幅 是 时 间 参 数 i 的 函数 , 记 为 A(1) 。 显 然 ,A(z) 随 1 而 异 ,A(io) 是 一 随机 变量 。 又 如 海 
浪 起 伏 的 振幅 可 视 为 依赖 于 点 (zx,y) 和 时 间 :的 随机 变量 。 在 此 基础 上 给 出 随机 函数 和 随 

1， 随 机 品 数 

设 人 2 一 {w} 是 随机 实验 E 的 样本 空间 ,各 对 每 个 wEN 都 有 一 个 郴 数 LT Ta ss Th io) 与 
之 对 应 (ziEXii 一 1,2, 1) 当头 取 任意 定 值 zao 时 ,ZCzioyzrz…zoiow) 是 一 个 随机 变 
量 , 则 称 ZI Tes XT, io) 是 定义 在 (zi -2 9 ;Ta ) 上 的 一 个 随机 函数 ，。 当 如 一 ] 时 , 称 上 
述 随 机 函数 为 随机 过 程 , 常 简 记 为 Z(x)。 

2， 随机 场 

随机 场 是 依赖 于 多 个 自 变量 的 随机 项 数 ,常用 的 是 以 空间 点 的 坐标 为 自 变量 的 随机 场 ， 
记 为 LT 9 Yu» Zoo) 。 在 此 ,以 上 代表 三 维 向量 (z,, yx)，, 并 把 随机 场 简 记 为 2Z(xX), 如 
磁场 .重力 场 等 都 是 空间 点 的 浮 数 ,并 有 不 辐 程 度 的 随机 性 , 故 可 将 其 视 为 随机 场 。 对 它们 
的 每 次 观测 结果 ,都 是 一 个 确定 的 空间 点 函数 , 当 x=xo 时 ,Z(xo) 是 个 随机 变量 。 

二 、 区 域 化 变量 

1， 区 域 化 变量 

区 域 化 变量 是 以 三 个 直角 坐标 为 自 变量 的 随机 场 Z(x)。 对 其 观测 前 它 是 一 个 随机 场 ， 
观测 后 得 到 它 的 一 个 实现 , 记 为 z(x)。 每 个 x(x) 是 一 个 三 元 实 函 数 或 空间 点 函数 。 

在 地 质 、 采 矿 和 油气 勘探 开发 领域 ,有 很 多 变量 可 以 视 为 区 域 化 变量 ,如 煤层 厚度 、 生 油 
宕 厚度 \、 储 集 层 厚 度 、 有 机 碳 售 量 。 对 于 这 一 类 的 地 质变 量 ,可 视 为 区 域 化 变量 在 二 维 空间 
的 分 布 。 各 种 矿 化 现象 是 某 种 元 素 含 量 在 三 维 空间 的 变化 。 

区 域 化 变量 同时 反映 变量 的 随机 性 和 结构 性 , 它 是 地 质 统计 学 的 研究 对 象 。 若 Z(z) 表 
示 储 层 厚度 ,那么 它 是 个 随机 变量 ,这 体现 了 储 层 厚度 的 随机 性 ;另外 ,在 点 x 和 和 x 十 h(h 是 
二 维 空间 的 距离 向 量 ) 处 的 储 层 厚度 ZC(x) 和 Z(x 十 h) 具 有 一 定 程度 的 自 相关 性 。 一 般 来 
说 ,h 越 小 ,相关 程度 越 高 。 自 相关 性 反映 了 变量 的 某 种 连续 性 和 结构 性 。 马 特 隆 在 研究 金 
属 矿 的 品位 时 指出 :“ 一 个 矿床 中 的 矿石 品位 的 分 布 具有 混杂 的 特征 ,其 中 一 部 分 是 结构 性 
的 ,而 另 一 部 分 则 是 随机 性 的 …… 因此 ,对 任何 一 个 矿床 进行 科学 的 (至 少 是 符合 实际 的 ) 估 
计时 ,必须 既 要 考虑 到 矿床 固有 的 结构 性 ,又 要 考虑 到 矿床 固有 的 随机 性 。” 

区 域 化 变量 反映 地 质变 量 的 如 下 特性 : 





石油 娄 字 地 质 





d@ 局 部 性 。 区 域 化 变量 只 局 限于 一 定 的 空间 内 , 称 该 空间 为 区 域 化 的 几何 域 。 

加 连续 性 。 区 域 化 变量 具有 各 自 的 连续 性 ,也 有 些 变量 具有 平均 的 连续 性 。 

@ 异 向 性 。 区 域 化 变量 在 各 个 方向 上 的 性 质 不 同 。 

@ 可 迁 性 。 它 是 指 区 域 化 变量 相关 性 的 局 部 性 。 区 域 化 变量 在 其 几何 域内 具有 明显 
的 相关 性 ,但 超出 它 的 几何 域 , 相 关 性 明显 降低 ,甚至 消失 。 

上 述 特 性 是 导致 传统 资源 量 估算 方法 存在 较 大 估算 假 差 的 主要 因素 ,而 地 质 统 计 学 的 
变 差 函数 , 则 能 较 好 地 研究 区 域 化 变量 的 上 述 特性 。 

2. 区 域 化 变量 的 数字 特征 

对 于 油气 勘探 开发 .资源 评价 等 领域 的 区 域 化 变量 ,一般 不 需要 知道 它 的 全 部 特征 ,只 
要 知道 它 的 某 些 数 字 特 征 就 足够 了 。 值 得 注意 的 是 ;与 随机 变量 的 数字 特征 不 同 ,区 域 化 变 
量 的 数字 特征 一 般 都 是 函数 。 以 下 介绍 区 域 化 变量 的 平均 值 .方差 和 协 方 差 郴 数 。 

(1) 区 域 化 变量 的 平均 值 函 数 。 

区 域 化 变量 Z(x) 的 平均 值 是 函数 ELZCxz)], 对 于 自 变 量 x 的 每 一 个 给 定 值 xo, 它 的 函 
数值 等 于 区 域 化 变量 Z(x) 在 x。 处 的 平均 值 , 即 

ELZ(x) |], = ELZ(xo)] (12-1) 

显然 ,ELZ(Cxz)] 是 区 域 化 变量 Z(x) 的 所 有 实现 z(x) 的 一 个 平均 函数 。 

(2) 区 域 化 变量 的 方差 函数 。 

区 域 化 变量 Z(Cz) 的 方差 是 函数 DI[Z(x)j, 对 于 自 变量 x 的 每 一 个 给 定 值 xo, 它 的 函 
数值 等 于 区 域 化 变量 Z(x) 在 x。 处 的 方差 , 即 

D’[ZCx) J] = DTZCxo) (12-2) 
方差 函数 也 可 以 记 为 Var[Z(x)]。D:[Z(x)] 既 表示 方差 ,又 表示 依赖 空间 点 的 位 置 


(3) 区 域 化 变量 的 协 方差 函数 。 

协 方差 函数 是 随机 过 程 Z(2) 中 的 数字 特征 。 它 是 Z(2) 在 时 刻 ,ts 处 的 两 个 随机 变量 
Z(t1) 和 2Z(#s) 的 二 阶 混合 中 心算 ,其 定义 为 ; 

Cov[ ZC21) ,262)] = E[Z(1)2682)] — ELZC)JELZ(t)] (12-3) 

常 简 记 为 Cla ,tz), 它 是 随机 过 程 Z(1) 的 自 协 方差 函数 ,简称 协 方差 隧 数 。 

对 于 区 域 化 变量 ZC(x), 把 上 式 中 ,ts 变 为 空间 中 的 两 点 x,x 十 h 处 的 两 个 随机 变量 
Z(x) 和 ZCx 十 h) ,仿照 式 (12-3) 可 得 相应 的 二 阶 混合 中 心 矩 ， 

Cov[Z(x),Z(x +h)| = CClx,x+th) 

= E[Z(x)Z(x+h)]— EL[ZC(x) ELZCx + h)] 

式 (12-4) 称 为 区 域 化 变量 Z(x) 的 自 协 方差 函数 ,简称 协 方差 消 数 。 

通常 C(x,x 十 h) 是 依赖 于 空间 点 x 和 增 量 有 的 函数 。 当 上 二 0 时 , 它 等 于 方差 函数 , 即 

Clx,xi0) = ELZ(x) — {ELZC(x)]}: = Di[2ZCx)|] = Var[ Z(x)] 
(12-5) 


(12-4) 


32 区 域 化 变量 的 变 差 函 数 及 理论 模型 


一 、 区 域 化 变量 的 变 差 泡 数 
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Bz,h) = Var[Z(7x) — Z(z + h)]j/2 
= E[Z(x) — Zz /2— {(E[Z(r) ~ Zr + h)])}’/2 
由 上 式 可 知 ,8(z, 有 是 在 x,zx 十 h 两 处 取 值 之 差 的 方差 
的 1/2。 若 B(x,h) 只 依赖 于 h( 灌 后 ,距离 .间隔 、 步 长 ) ,那么 
变 差 函 效 可 记 为 8C(h)。 以 B(h) 和 为 纵横 坐 标 绘 出 的 图 | 
形 叫做 变 差 图 (图 12-1)。 变 差 函 数 有 a,C,C。 三 个 主要 参 
数 ,其 中 a 为 变 程 ,反映 变量 的 影响 范围 ;C 为 块 金 常数 , 反 a 
映 变量 的 连续 性 ;C, 十 C 为 基 台 值 ;C 为 拱 高 。 
变 差 函 数 既 能 描述 区 域 化 变量 的 空间 结构 性 ,又 能 描述 
其 随机 性 , 它 是 地 质 统计 学 所 特有 的 基本 工具 ,也 是 进行 地 
质 统计 学 计算 的 基础 。 当 x 和 上 在 二 或 三 维 空间 变化 时 ,还 要 考虑 二 或 三 维 变 差 函 数 。 
二 、 平稳 假设 与 本 征 假 设 
由 式 (12-6) 可 知 , 欲 知 8C(z,h) 的 估计 值 , 需 知 EL[Z(z) 一 Z(zx 十 hy) 和 EL[Z(z) 一 
Zlz 十 h)]。 若 用 观测 值 的 平均 值 作为 它们 的 估计 值 , 就 必须 对 ZCz) 和 Z(z 十 h) 进 行 若干 
次 观测 。 但 实际 工作 中 不 能 重复 观测 ,只 能 得 到 一 对 数据 z(z) 和 z(z 十 h), 因 此 ,无 法 求 出 
BCz,h) 的 数学 期 望 。 为 此 ,对 Z(z) 给 出 以 下 假设 。 
1]. 二 阶 平稳 假设 
如 果 Z(z) 满 足 条 件 : 
中 Z(z) 在 整个 研究 区 域内 的 数学 期 望 存 在 且 为 常数 , 即 
ELZ(Cz)] =m, Vx 
QZ(z) 在 整个 研究 区 域内 的 协 方差 函数 存在 是 相同 , 即 
CovLZ(z),Z(z 十 让] 一 形 LZCz)Z(z 十 1 一 mr ACCh),Yz 
当 A 一 0 时 ,上 式 变 为 
Cov[LZ(z),ZGz 十 0)] = Cov[Z(z),ZCz)] = Var[Z(x)],Yx (12-7) 
则 称 ZC(z) 满 足 二 阶 平稳 (或 弱 平 稳 ) 假 设 ， 
上 述 结果 表明 ,Z(z) 在 整个 研究 区 域内 的 协 方差 函数 只 依赖 于 滞后 h, 而 与 x 无关 。 
当 有 =0 时 ,Z(z) 在 整个 研究 区 域内 的 方差 存在 且 为 常数 。 
2. 本 征 假 设 
若 Z(z) 在 整个 研究 区 域内 不 满足 二 阶 平稳 假设 , 则 提出 以 下 本 征 假设 。 
如 果 Z(Cz) 的 增 量 AZ(x) = 二 ZC(zx) 一 Z(z 十 h) 满 足 条 件 ; 
Q@ AZ(z) 在 整个 研究 区 域 上 的 数学 期 望 等 于 0, 即 
FE[AZ(Cz)] 王 0，Vzy VPR 
@@ AZ(z) 的 方差 函数 在 整个 研究 区 域 上 存在 且 平 稳 , 即 
Var[AZ(z)] = E[Z(x)— Z(zt+h)],YVzr,Vh (12-8) 
则 称 Z(x) 满 足 本 征 假设 ,或 者 说 Z(z) 是 本 征 的 。 
在 平稳 假设 和 本 征 假设 下 , 增 量 AZ(x) 的 数学 期 望 为 0, 并 与 具体 位 置 zx 无 关 , 因 此 变 
差 肾 数 式 (12-6) 变 为 ， 





图 12-1 变 差 函 数 示 意图 


Bh) = ELZ(x) — Zz h)]/2 
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上 式 表 明 ,Z(z) 在 点 xz 和 zx 十 h 处 的 值 上 差异 ,8C4) 反 映 了 它们 的 变异 程度 。 
由 式 (12-8),(12-9) 得 ， 
28(h) = Var Z(x) — Z(z+th)| (12-10) 
本 征 假 设 条 件 @ 与 Z(x) 的 变 差 函数 存在 且 平 稳 是 等 价 的 。 
从 二 阶 平稳 假设 与 本 征 假 设 的 定义 可 知 ,两 者 的 研究 对 象 不 同 ,前 者 讨论 Z(x) 本 身 的 
特征 ,而 后 者 讨论 ZCz) 增 量 的 特征 ,并 且 前 者 的 要 求 强 于 后 者 。 
三 、 实 验 变 差 函 数 的 计算 公式 
它 是 根据 ZC(z) 的 观测 值 构造 的 变 差 函数 , 记 为 8* (4)。 在 二 阶 平稳 假设 或 本 征 假 设 
下 ;可 视 [zCzxi) ,zCzxi 十 h) 为 LZCzxi),Z(z; 十 h) 的 不 同 实 现 。 此 时 ,实验 变 差 函 数 的 计算 式 
为 : 
B* (h) = [zc 一 &Czi +h) (12-11) 
式 (12-11) 是 观测 值 规则 分 布 情况 下 实验 变 差 函数 的 计算 式 ,其 中 是 被 h 相隔 的 数据 对 个 
数 。 
把 h; 代入 式 (12-11) 求 出 相应 的 B* (4h1) ,并 以 hi,B"(h;) 为 绘图 数据 ,在 hB"(h) 坐 标 
系 中 绘制 一 幅 折 线 图 (实验 变 差 图 数 图 ) 。 
【 例 13 设 有 甲 、 乙 两 个 地 质 单元 ,在 相同 方向 上 测 得 它们 的 储 层 厚 度数 据 ( 表 12-1) 。 
表 12-1 地 质 单元 储 层 厚度 数据 表 
甲 地 质 单元 储 层 厚度 全 = 
乙 地 质 单元 储 层 厚度 | 1 | 


解 :由 实测 数据 可 知 , 甲 、 乙 地 质 单元 储 层 厚度 的 均值 ,方差 相同 ,不 能 用 它们 区 别 甲 、 乙 
奈 单 元 储 层 厚 度 变化 的 差异 。 实 际 上 储 层 厚度 沿 观 测 方 向 的 变化 有 明显 的 差异 (图 12-2) 。 
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图 12-2 储 层 厚度 沿 观 测 方向 变化 示意 图 
采用 实验 变 差 函 数 分 析 厚 度 沿 观测 方向 的 变化 规律 ， 取 大 = 500, 据 式 (12-11) 计 算 实 
验 变 差 函 数值 。 


甲 单 元 实验 变 差 函数 值 为 : 
有 全 3a Ler) ala +h)] = 3.1 
B’ (2h) = yO Lee) 一 zc 2 
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g" (3h) 一 5 eC) 一 < 0 


B* (4h) = 3 31 DL )—z(zx;t 4h) 1 = 4.5 


同 理 , 乙 单元 实验 变 差 函数 值 为 :8* (h) 二 0.5,8" (24) 二 2,8* (3h) 一 4.5,8” (4h) 二 8。 

储 层 厚度 实验 变 差 函 数 图 (图 12-3) 反 映 了 甲 、 乙 单元 储 层 厚 度 沿 观测 方向 的 变化 有 明 
显 的 差异 。 甲 单元 实验 变 差 函数 曲线 的 变化 趋势 基本 上 代表 了 储 层 厚 度 沿 观测 方向 的 波状 
起 伏 。 乙 单元 实验 变 差 函数 曲线 的 变化 趋势 反映 了 储 层 沿 观测 方向 急剧 加 厚 。B"”(m) 与 所 
具有 和 良好 的 相关 性 ,显示 了 储 层 厚度 的 结构 性 。 

【 例 2】 设 生 油 岩 厚度 是 满足 本 征 假设 的 二 维 区 域 化 变量 Z(z) ,并 在 和 矩形 区 域内 得 到 了 
它 的 若干 观测 值 z(z) (图 12-4)。 设 小 正方 形 的 边 长 为 a, 试 在 al ,as ,as,a4 方向 上 各 计算 
三 个 视 后 距 上 | 的 实验 变 差 函数 值 ,并 做 出 a 和 as 方向 的 实验 变 差 函 数 图 。 
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图 12-3 ” 储 层 厚 并 实验 变 差 函数 图 图 12-4 生 油 岩 厚 度 分 布 图 


解 :在 每 个 方向 上 取 三 个 不 同 的 |h| 值 ,根据 式 (12-11) 计 算 各 方向 上 的 8* (4)。 
OD 方 则 a (Ih|=a). 
BP’ (a) = 1(32—23)? 十 (27 一 30)?* 十 (30 一 32)? 十 (24 一 26)? 十 (26 一 31)? 
十 (27 一 25)? 十 (25 一 27)? 十 (27 一 25)? 十 (27 一 27)? 十 (27 一 29)? 
十 (29 一 29 六 十 (29 一 31)? 十 (25 一 25)? 十 (25 一 25)? 十 (25 一 23)? 
十 (25 一 25)2 十 (25 一 23) 十 (23 一 23)2 十 (23 一 24)2 十 (24 一 21)? 


十 (21 一 25)° 十 (25 一 27)? 十 (27 一 31)? 十 (31 一 31)?1]/(2 X 24) 
一 4. 10 


同 理 ， 
8 (2a) = 336/(2 x 19) = 8. 84 
B* (3a) = 435/(2 x 18) 一 12.08 
四 方 同 az (|h|=a): 
B” (a) = 187/(2 x 22) 一 4.26 
8 (2a) = 296/(2 XxX 18) = 8. 22 
B” (3a) = 327/(2 x 15) = 10. 90 








@@ 方向 cs (| 一 V2a) : 
B* (V2a) 一 191/(2X19) = 5.03 
B* (2 2a) = 381/(2 Xx 16) = 11.91 
8B* (3Y2a) = 345/(2 X 10) = 17, 25 
@ 方向 al|h|==V2a); 
: PB’ (V2a) = 233/(2 Xx 18) = 6.47 
B* (2V2a) = 315/(2 X 14) = 11. 25 
B* (3V2a) = 247/(2 XxX 8) = 15., 44 
根据 上 述 数 据 绘 出 a1 ,a; 方向 的 实验 变 差 晴 数 图 (图 20 
12-5)。 
由 本 例 看 出 ,在 观测 值 规则 分 布 的 情况 下 , 随 着 点 对 pss， 
之 间距 离 的 增 大 ,参与 计算 的 数据 对 数 逐 渐 减 少 ,这 就 意 10 
味 着 变 差 函 数 曲 线 上 的 点 距 原点 越 远 , 它 的 可 靠 性 越 差 。 5 
四 、 变 差 函 数理 论 模 型 
为 了 对 区 域 化 变量 进行 估计 ,还 需 将 实验 变 差 函数 
拟 合成 相应 的 理论 变 差 函 数 模 型 ,这 些 模型 将 直接 参与 
克 立 金 法 的 资源 量 估 算 以 及 其 他 估 值 。 下 面 讨论 一 维 区 图 12-5 后 油 岩 厚度 实验 变 差 
域 化 变量 变 差 隆 数 的 理论 模型 ,它们 可 分 为 两 大 类 。 函数 图 
1. 有 基 台 值 模型 
(1) 球状 模型 。 
该 模型 的 一 般 表 达 式 为 : 
0 六 宇和 科 





3 
Bl7) = JC, + CC zs) Ue (12-12) 


Go r>a 
式 中 Co 一 一 块 金 常 数 ，; 

Co 十 4 一 一 台 值 ; 

C 拱 高 ; 

a 一 一 变 程 。 
当 Co 二 0,C 二 1 时 ,模型 称 为 标准 球状 模型 (图 12-6) 。 
(2) 指数 函数 模型 。 
该 模型 的 一 般 表 达 式 为 : 








Br) 一 Co 十 CC1L 一 e””) (12-13) 
式 中 ”Go 一 一 块 金 常 数 ， 
Co 十 CC 一 一 基 台 值 ; 





C 一 一 拱 高 ; 
3a 一 一 变 程 。 





当 C=0,C=1 时 ,模型 称 为 标准 指数 模型 (图 12-6)。 


-+ ! 
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图 12-6 变 差 函 数 模型 
(3) 高 斯 模型 。 
该 模型 的 一 般 表 达 式 为 : 
Br) = C+C(l—e"’”) (12-14) 
式 中 ”Co 一 一 块 金 常 数 ， 
Cu 十 C 一 一 基 台 值 ; 
C 拱 高 ; 
V3a 一 一 变 程 。 
当 Cs,=0,C=1 时 , 称 模型 为 标准 高 斯 模型 (图 12-6) 。 
2， 无 基 台 值 模型 
(1) 只 了 晒 数 模型 。 
该 模型 的 一 般 表达 式 为 : 
BD)=r* 0<0<2 (12-15) 
常用 的 是 9 二 1 的 线性 模型 (图 12-7) , 即 
BCr) 一 or 《12-16) 











12-7 等 函数 模型 
式 中 w 为 一 常数 ,表示 直线 的 斜率 。 对 于 很 小 的 | 天 | ,可 用 线性 拟 合 在 原点 处 具有 线性 状 的 
任 一 模型 (如 球状 模型 )。 

(2) 纯 块 金 效 应 模型 。 

该 模型 的 一 般 表 达 式 为 ; 


0 r 二 0 
8(r) = 人 (12-17) 
该 模型 适合 于 对 纯 随 机 变量 的 估计 。 可 视 其 a 为 无 穷 小 量 ,C 一 0, 对 任何 ~>0,8(r~) 都 


能 达到 基 台 值 C, 。 
$3 实验 变 差 函 数 的 拟 合 与 结构 合 合 
一 、 实 验 变 差 函数 的 拟 合 


无 论 是 要 了 解 Z(Cz) 的 变异 特征 ,还 是 要 对 其 进行 估算 ,都 必须 知道 变 差 图 数 的 理论 模 
型 以 及 模型 中 的 参数 。 为 此 ,首先 要 根据 Z(Cz) 的 观测 值 zCri) (i 二 1,2,…,n), 按 式 (12-11) 
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数 。 实 际 工作 中 的 大 部 分 变 差 函数 模型 是 球状 模型 ,在 此 假设 下 ,讨论 实验 变 差 函 数 的 拟 


ID> 泌 


1. 直接 拟 会 
(1) 求 变 程 a。 计 算 观 测 值 的 实验 方差 


5 一 一 > 2 
i=1 





n—1 
式 中 z 一 二 Dz(z)， 


在 实验 变 差 函数 图 (图 12-8) 的 纵 坐 标 轴 上 过 ?点 作 。 
平行 于 横 轴 的 直线 。 设 直线 1 与 8* (4) 的 头 部 有 2 一 3 个 交 0 
点 ,并 与 过 o"? 点 的 直线 相交 ,交点 的 横 坐 标 为 24/3, 假 定 其 
值 为 h,, 则 a 二 3ho/2。 

(2) 求 块 金 值 。 直 线 1 与 纵 轴 交点 的 纵 坐 标 为 块 金 值 C。。 当 Co<C 时 , 取 Co=0。 

(3) 求 拱 高 值 。 拱 高 C=o* 一 C。。 

2. 多 项 式 回归 拟 合 球状 模型 

对 于 球状 模型 0 二 ha 的 情况 , 邻 

0 3， bs —— 2 
则 有 y = Bb 十 bizxi 十 56xs ,利用 线性 回归 方法 可 求 得 上 式 中 的 5 ,61 ,bs ,进而 求 出 球状 模 
型 。 

3, 交叉 验证 

交叉 验证 即 检验 确定 的 变 差 销 数 是 否 符合 实际 ,用 统计 的 术语 就 是 估计 值 与 真实 值 的 
误差 平方 和 是 否 最 小 。 具 体 方法 是 :对 于 每 个 实测 点 ,用 其 周围 点 上 的 值 对 该 点 进行 克 立 金 
估 值 。 车 有 "个 实测 点 , 则 各 有 个 实测 值 和 克 立 爹 估计 值 ,其 误差 平方 为 E=(2Z* 一 2)?， 
误差 平方 的 均值 为 已 。 巨 越 小 , 拟 合 的 变 差 函 数 越 好 ，。 

二 、 实 验 变 差 函 数 的 结构 又 全 

Z(z) 的 变异 性 通常 包含 各 种 尺度 上 的 多 层次 的 变异 性 ,反映 在 变 善 函 数 上 ,就 是 其 结 
构 性 往往 不 是 单一 的 ,而 是 多 层次 结构 的 释 加 ,这 种 变化 结构 称 为 到 合 结构 。 大 尺度 的 变异 
总 是 包含 小 尺度 的 变异 ,但 是 却 不 能 从 大 尺度 的 变异 性 中 区 分 出 小 尺度 的 变异 性 。 实 验 变 
差 西 数 结构 合 合 的 目的 是 获得 一 个 随 着 距离 和 方向 变化 的 变 差 函数 。 

1. 各 向 同性 条 件 下 的 结构 重合 

各 向 同性 是 指 Z(z) 在 不 同方 向 上 的 变异 性 相同 。 此 时 ,可 直接 将 变 差 函 数 奏 合 , 即 

Br) = Br) 二 Bi(r) t+: 
不 同 尺度 上 的 结构 可 以 是 相同 模型 ,也 可 以 是 不 同 模型 。 若 某 各 向 同性 Z(x) 的 变 差 函数 由 


图 12-8 求 参数 示意 图 
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淋 十 二 童 充 立 印 法 组 全 





Al 0 去 7 了 < 魏 4a; 
Blr) 一 las 20 
Gs rr > as 
三 个 不 同 尺 度 上 的 结构 组 成 , 则 ZCz) 的 变 盖 函数 为 上 述 变 差 郴 数 的 和 , 即 
二 0 
(Lo 十 3/L2CC1 /a 十 Cz/az)rj 国王 1/[2CC/ai 十 Cs /a3)r | 0 ~ r < 好 1 
一 (12-18) 
有 CO + CI 一 二) al ras 
202 2d2 
r > U2 


Ce 十 Ci 十 人 
登 合 过 程 如 图 12-9。 






PC) 


Co+CI+C 





图 12-9 各 向 同性 琶 合 过 程 示 意图 


2. 各 向 异性 条 件 下 的 结构 有 登 合 

各 向 异性 是 指 Z(zx) 在 不 同方 向 上 的 变异 性 不 同 , 它 又 分 为 几何 、 带 状 和 混合 各 向 异性 。 
几何 各 向 异性 的 基 台 值 在 各 方向 上 相同 ,但 变 程 不 同 ( 图 12-10a); 带 状 各 问 异 性 与 几何 各 
向 异性 相反 (图 12-10b) ;混合 各 向 异性 的 基 台 值 和 变 程 在 各 方向 上 都 不 同 (图 12-10c) 。 
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(a) 几何 各 问 异 性 (b) 带 状 各 向 异性 (c) 混合 各 向 异性 





图 12-10 不 同类 型 各 向 异性 变 差 图 
(1) 几何 各 向 异性 下 的 结构 友 合 。 
当 Z(Cz) 为 几何 各 向 异性 时 ,要 先 对 同一 尺度 上 的 各 向 异性 结构 进行 各 向 同性 化 处 理 ， 
然后 再 把 同性 化 后 的 不 同 尺度 上 的 结构 进行 倒 合 。 
@ 变 差 函数 的 各 向 同性 化 变换 。 
设 区 域 化 变量 在 zx 和 y 方向 上 的 变 差 区 数 分 别 为 : 


a 
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BGA 人 ) 0 < 之 ha 
C h, >a; 
0 h, 一 0 
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那么 ,它们 的 基 台 值 均 为 C(0) ,在 两 个 方向 上 的 变 程 分 别 为 a. 和 wa, ,属于 几何 各 向 异性 。 
通过 式 
h,./a.” 
二 了 网 | h= Var) + Ch ay 
对 坐 称 变换 后 ,得 到 一 个 各 向 同性 化 的 变 差 函数 


0 h=0 
Bh) = J C3h/2 — h: /2) 0<hl (12-19) 
C h>1 


意 : 只 有 当 8(h;),B(h,) 的 函数 类 型 相同 时 ,才能 进行 上 述 坐 标 变 换 。 
加 不同 尺度 上 的 结构 释 合 。 
在 对 同一 尺度 上 的 几何 各 向 异性 同性 化 后 ,可 对 不 同 尺度 上 的 结构 进行 琶 合 ,得 ， 
BC(h) = BiChi) + BChs) (12-20) 
式 (12-20) 是 如 下 
Bhi) =B vhs/an) 十 (及 /aa 
Br (hz) = Be vhs/ara)’ + Ch,/aya) 
两 个 各 向 同性 化 之 后 的 变 差 哨 数 的 又 加 。 
(2) 带 状 各 向 异性 下 的 结构 钱 合 。 
演 状 各 问 异 性 的 变 差 函 数 可 以 看 做 一 种 不 同方 向 结构 的 释 合 结构 。 在 此 结构 中 ,可 直 
接 把 各 部 分 相 加 , 即 


BOh) = > Bh) (12-21) 
i=1 


(3) 混合 各 向 异性 下 的 结构 秋 合 。 

在 混合 各 向 异性 中 ,每 一 个 组 成 结构 可 以 具有 各 自 不 相同 的 异 向 性 ,但 都 可 以 通过 适当 
的 线性 变换 化 为 各 向 同性 后 羡 加 ,其 中 有 的 8.(4) 可 以 是 几何 异 向 性 的 ,对 每 个 组 成 结构 分 
别 进行 一 种 适当 的 坐标 线性 变换 ,把 它们 转化 为 各 向 |B() 
同性 结构 ,最 后 再 把 这 些 各 向 同性 结构 又 加 ,构成 一 
个 统一 的 变 差 函数 模型 。 例 如 ,对 于 在 水 平和 垂直 方 
向 上 变 程 为 a; ,a, ,a; 的 区 域 化 变量 ,可 以 把 水 平方 向 
各 问 同 性 化 后 ,再 加 上 入 直方 向 的 结构 (图 12-11)。 

ee a 
hs /a,)*]? 3; 垂直 方向 的 结构 为 B (hs) 站 11 混合 各 向 异性 变 差 函数 示意 图 
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一 gCh./a.) ;区 合 后 的 结构 为 BA 一 局 (hi) 十 BChs)。 
94 元 立 金 法 
经 过 不 断 发 展 和 完善 ,逐渐 产生 了 适合 不 同情 况 的 克 立 金 法 。 从 资源 预测 的 角度 来 说 ， 
多 数 克 立 金 法 是 根据 一 个 区 域内 外 若干 样品 的 某 种 特性 的 观测 值 ,对 该 区 域 同类 特性 进行 
线性 无 偏 .最 小 方差 估计 的 方法 。 具 体 地 说 ,该 方法 是 在 考虑 了 样品 的 形状 、 大 小 及 其 与 待 
估 域 之 间 的 空间 分 布 位 置 等 几何 特征 ,以 及 变量 的 空间 结构 信息 后 ,为 了 达到 线性 无 俐 和 最 
小 估计 方差 ,而 对 每 一 个 观测 值 分 别 赋予 一 定 的 权 系数 ,最 后 用 加 权 平 均 的 方法 估计 竺 佑 域 
的 同类 特性 。 
一 、 线 性 估计 量 : 
设 z(v1) (i 二 1,2,…,n) 是 ZC(zx) 在 信息 域 v.(i 二 1,2,…,n) 上 的 观测 值 , 待 估 域 V 上 的 
真 值 为 Zv,z 为 V 的 中 心 。 通 常 来 说 ,Zv 的 估计 量 Z* 是 诸 zCwv;) 的 函数 ,将 该 函数 记 为 : 
Z* = flz(v),z(v) ,Cv )] (12-22) 
我 们 期 望 在 无 偏 性 和 最 优 性 (估计 方差 最 小 ) 的 条 件 下 来 确定 f/。 在 此 , 仪 取 f 为 线性 
函数 的 形式 , 即 
Z” = Sew 一 3 s| Zod G12-23) 


i 二 1 


在 平稳 假设 条 件 下 采用 线性 估计 量 , 可 以 求 出 E(Zy 一 2" ) 和 El(Zy 一 2Z* ) ,由 此 可 以 
进一步 讨论 在 无 偏 性 和 最 优 性 条 件 下 ,如何 确 定式 (12-23) 中 的 权 系 数 和;。 

二 、 无 偏 性 条 件 和 线性 估计 方差 

1. 无 偏 性 条 件 

采用 式 (12-23) ,在 满足 无 偏 性 和 最 优 性 条 件 下 ,可 以 求 出 权 系 数 4;, 得 到 线性 佑 计量， 
无 偏 性 条 件 要 求 E(Zy 一 2Z* )==0, 由 此 分 EC(Z(z)) 为 已 知 和 未 知 两 种 情况 进行 。 

(1) ELZ(z)] 为 已 知 的 无 偏 性 条 件 。 

设 E[Zlz)|==mr( 常 数 ), 令 Zl(z) 一 Zl(z) 一 m, 因 Zl(xz) 为 二 阶 平稳 区 域 化 变量 ， 
故 Z'(z) 也 是 二 阶 平稳 区 域 化 变量 , 且 ELZ (z)]=0。 若 能 对 Z (z) 在 待 估 域 V 中 的 变量 
Z* 值 进行 估计 ,就 可 以 通过 Z(r)==Z' (zx) 十 m 对 Z(z) 在 待 估 域 V 中 的 变量 Z'* 值 做 出 佑 
计 。 为 此 ,把 式 (12-23) 改 写 为 ; 


2 = D0) = DE Ze (12-24) 
i=1 i 


可 以 证 明 , 当 E(Z(zx)) 二 m 时 ,满足 无 偏 性 条 件 。 
(2) E[LZ(Cz) 为 未 知 的 无 俩 性 条 件 。 
因为 Zv 和 2 "都 是 随机 变量 ,可 以 证 明 , 要 使 下 (Zv 一 2Z”) 王 0, 必 须 使 


> = 1 
2. 满足 无 偏 性 条 件 时 线性 估计 方差 的 计算 公式 
当 满 足 无 偏 性 条 件 时 ,可 以 证 明 估 计 方 差 的 计算 公式 为 


a= CV DY) >》MiC(o YY) — 2 ACOV, v0,) (12-25) 
i=1 


1 一 1] j=] 
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式 中 


CV,V) = 去 | | C= 
VijJvjJv 

COV ,vw) =- 元 | | 二 
YY， Vy 
Wi Wd 


其 中 C(V,V) 代 表 上 距离 向 量 的 两 个 端点 各 自 独 立地 扫描 过 整个 V 时 ,所 得 变 差 函 数 的 平均 
值 ;CCvi ,vj) 代 表 距 离 向 量 的 两 个 端点 各 自 独立 地 扫描 过 v ,wv; 时 ,所 得 变 差 函 数 的 平均 值 ; 


CC(V ,vi) 代 表 距 离 向 量 的 两 个 端点 各 自 独立 地 扫描 过 V,v 时 ,所 得 变 差 函 数 的 平均 值 。 
用 vv 表示 所 有 的 v;, 则 有 : 


C(V,v) = SACOV ,vi), Cl(v,v) 一 SY 
则 和 估计 方差 的 计算 公式 可 简写 为 ; 
og = CVV) + Cv,v) 一 2CCV ,wv) (12-26) 

3，, 关于 估计 方差 的 说 明 

(1) 用 域内 的 信息 对 域 V 作 估 计 求 得 的 上 , 也 称 为 v 对 V 的 外 延 方差 , 记 为 且 (v,V)。 

(2) 不 论 v 和 V 是 怎样 的 域 , 式 (12-26) 都 适用 。 

(3) 可 以 把 变 差 函数 

BCh) = ELZ(x) — Zz+th)l/2, Vr 

视 为 用 Z(zx 十 h) 佑 计 ZC(z) 时 的 估计 方差 的 一 半 ，。 

(4) cz 是 衡量 估计 量 优 劣 的 一 个 指标 ,oz 越 小 ,估计 量 越 好 。 

(5) 影响 of 大 小 的 因素 有 四 个 方面 : 

(D BL(h) 反 映 了 ZLz) 的 结构 特征 和 空间 连续 性 ,因此 它 的 数学 模型 是 影响 因素 之 一 。 

(WV 的 几何 特征 ,如 大 小 .形状 等 。 总 的 来 说 ,V 越 大 ,8(V,V) 也 越 大 ,于 是 a2 则 相应 
变 小 。 

3 v 的 几何 特征 、 数 量 和 空间 排列 等 。 一 般 说 来 ,v 越 大 ,样品 越 多 ,距离 越 远 ,8(v,v) 
则 越 大 ,oz 则 越 小 。 

获得 佑 域 与 信息 样品 之 间 的 距离 越 大 ,8(V ,v) 就 越 大 ,因此 叶 就 越 大 。 

三 、 克 立 金 法 

1. 简单 克 立 金 法 : 

它 是 二 阶 平稳 假设 下 的 一 种 线性 无 偏 估计 。 当 EL[Z(zx)]= 二 m( 已 知 常数 ) 时 ,无 偏 性 条 
件 自 然 满 足 , 由 此 转化 为 在 估计 方差 最 小 条 件 下 求 取 式 (12-24) 中 的 参数 4;。 对 式 (12-25) 
中 诸 4; 求 偏 导 数 , 并 令 其 等 于 0, 化 简 整 理 后 得 : 


DNC lv sd) = CV ,vw;) (1 = 1,2,"*,n) (12-27) 


J 一 1 


由 方程 组 (12-27) 可 以 解 出 权 系数 4;(i 二 1,2,…,n) ,代入 式 (12-24) 对 2 进行 估计 ， 
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2. 普通 克 立 金 法 
它 是 本 征 假设 下 的 一 种 线性 无 偏 最 优 估计 。 无 偏 是 要 求 权 系 数 的 和 为 1, 最 优 是 要 求 
达到 估计 方差 最 小 。 这 属于 满足 无 偏 条 件 下 求 条 件 极 值 的 问题 。 为 此 ,构造 一 个 新 的 函数 


F= 6 — 2 2 一 1 (12-28) 
i 一 ] 





式 中 pj 一 一 拉 格 朗 日 算 子 。 
对 式 (12-28) 中 诸 和 和 求 偏 导 数 ,并 令 其 等 于 0, 化 简 整 理 后 得 普通 克 立 金 方程 组 


撞 


poe -一 1 


由 起 (12-29) 可 以 解 出 权 系数 ;和 ,把 和 ;代入 式 (12-23) 可 求 得 估计 域 V 中 变量 的 信 
计 值 Z*。 

把 4 代入 式 (12-26) 化 简 整 理 , 得 到 估计 方差 的 简化 表达 式 , 将 其 称 为 普通 克 立 金 方 
差 , 记 为 : 


SAC Cui sv;) 一 CV ,vi) 
(1 == 1 ,2 ,…… 11) (12-29) 


ga = CC(V,V) 一 SC 十 天 (12-30) 
3。 指示 克 立 金 法 
它 是 针对 非 参数 和 无 分 布 的 区 域 化 变量 提出 的 一 种 克 立 金 法 。 它 可 以 在 保留 实际 存在 
的 高 值 数 据 条 件 下 ,处理 各 种 不 同 的 现象 ,并 给 出 一 定 概率 条 件 下 变量 的 估计 值 及 其 空间 分 
布 。 
(1) 指示 函数 。 
对 于 任意 给 定 的 阔 值 zx ,对 每 个 样品 点 x; 定义 指示 函数 
0 ZT) > ZL 
T(zisz) = (k= 1,2,.,K) (12-31) 
4 Zi 挟 、2 
指示 函数 T(x;;zi) (4 二 1,2,…,K) 的 物理 含义 是 样品 点 zx; 处 随机 变量 Z(z) 的 概率 分 
布 函 数 , 即 
F(ziszi) = p| ZCz) Sz |= T(zxijz) 一 | 0 
1 zz) < zh 
(12-32) 
(2) 指示 协 方差 函数 和 指示 变 差 函数 。 
视 指示 函数 为 区 域 化 变量 ,以 代表 点 x 和 十 h 之 间 的 距离 ,仿照 区 域 化 变量 的 协 方 
差 函 数 和 变 差 函数 ,定义 指示 协 方差 函数 和 指示 变 差 函数 为 : 
Chsz.) = Cov[ T(z;z) ,T(r h;z,) | 
= E{I(x;z.) — ELI(x;z) )} {T(z h;z) — ELICzth;z,)} 
(Vx, Vhsk= 1,2,.,K) 
(12-33) 
Bhsza) = VarLl(zsz) — I(z+hsz)]/2 (k=1,2,.,K) (12-34) 
在 二 阶 平稳 假设 下 ,指示 协 方差 函数 和 指示 变 差 函数 的 形式 为 : 
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Ci CR ) 一 CovLTCzyze) (十 户 ?zx ) | 
一 ELI(z;yz)I(zt hsz) 一 He (k= 1,2,.,K) 
Bi(hsza) = ELICzyze) — T(zthsz) /2 (k=1,2,.,K) (12-36) 
在 二 阶 平稳 假设 下 ,指示 协 方差 函数 和 指示 变 差 函 数 的 关系 为 : 
BiChsze) = Ci(O0;z) — Crlhsz) (k= 1,2,..,K) 《12-37) 
实验 变 差 函数 的 计算 式 为 : 


(12-35) 


By (h;z) 一 DN sz) 一 Tc 十 ja] (k=1,2,..,K) (12-38) 


式 中 x 一 一 相距 的 数据 点 对 的 个 数 ， 
指示 变 差 函数 拟 合 的 原理 和 过 程 与 区 域 化 变量 变 差 函 数 拟 合 的 原理 和 过 程 相 则 。 
(3) 指示 死 立 金 方程 组 。 
假设 变量 无 空间 结构 性 ,那么 x 点 处 随机 变量 Z(z) 的 概率 分 布 函数 为 : 
F(Czyzkej/a) = pLZ(x) < ze/n) 





: (12-39) 
= 1 D1 2) (k=1,2,.",K) 


式 申 ， 下 是 z, 和 ZCzxi)(i 一 1,2,…,n) 的 聘 数 。 
假设 变量 存在 空间 结构 性 ,那么 估计 之 点 处 ZC(zx) 的 概率 分 布 函数 则 需 引 用 指示 克 立 金 
法 。 
当 Z(z) 存 在 空间 结构 性 时 , 则 有 
Flxszi/n) = pL[Z(x) < zi /n) 
(12-40) 
一 >jCz52D)ACzHzs) (ko—1,2,..,K) 


式 (12-32) 和 (12-40) 表 明 , 求 F(z;z/n) 可 以 看 做 用 已 知 的 T(z;zi) 来 估计 未 知 的 T(x;z)。 


由 概率 理论 可 以 证 明 D1 ;z4) 确实 是 已 知 n 个 数据 时 ZC(zr) 的 条 件 概率 分 布 函数 ,或 是 


I(x;z) 的 线性 估计 ， 即 
Flryzi/n) = I (xy) 





n (12-41) 
= SACrsz) /rsze) (k= 1,2,..,K) 
给 定 任意 一 点 工 和 xz, 可 建立 指示 克 立 金 方程 组 
DN Crs ei) B(x — TL) Tur;R) 一 (人 一 区 52) 
j=1 
2 (12-42) 
Slrszi) = 1 (i = 1,2,*…,n) 
j 一 1 
式 中 BpB: 一 一 指示 变 差 函 数 ; 
Zi 一 站 一 两 个 样品 点 之 间 的 距离 ; 
I 





由 式 (12-42) 可 以 解 出 系数 A Cz;zi) 和 (zr;z6) ,代入 式 (12-41) 便 可 求 出 六 (x ;zi)。 
: 通常 把 Zz(Xi) (i 二 1,2,'"… ,nn) 分 成 K 个 国信 TI TF TK ,因此 在 每 一 点 并 上 有 K 个 指 
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示 克 立 例 方程 组 需要 求解 ,从 而 可 得 到 KK 个 1* (zx;zi) 估 计 值 ,它们 分 别 对 应 符 估 点 zx 处 
Z(zr) 小 于 下 个 阅 值 zi; ,zs，… ,zx 的 概率 。 | 

由 上 可 知 ,在 不 同 的 点 上 可 得 到 不 同 的 概率 分 布 曲线 ,从 这 些 概 率 分 布 曲 线 上 可 以 读 出 
Z(z) 在 不 同 点 出 现 小 于 某 个 定 值 zo 的 概率 ,由 此 可 绘 出 等 概率 图 。 也 可 以 根据 不 同 点 的 
概率 分 布 曲线 ,事先 确定 一 个 概率 值 po, ,绘制 变量 等 值 线 图 ,在 该 图 上 可 以 读 出 在 概率 po 
下 Z(Cz) 的 值 。 这 两 种 图 形 皆 可 反映 区 域 化 变量 的 随机 性 。 

(4) 几 点 说 明 。 

@ 指示 克 立 金 法 给 出 Z(z) 在 空间 某 点 处 的 概率 分 布 曲线 ,由 此 既 可 对 Z(z) 的 不 确定 
性 进行 度量 ,又 可 给 出 Z(zx) 的 值 大 于 (或 小 于 ) 某 个 给 定 值 的 概率 ,这 一 结果 可 用 于 资源 量 
预测 一 类 的 问题 。 

@ 普通 克 立 金 法 用 克 立 金 估 计 方 差 描述 不 确定 性 ,而 指示 克 立 金 法 则 用 概率 来 拍 述 。 

@ 指示 克 立 金 法 是 一 种 非 线 性 . 非 参 数 估 计 方 法 。 

@ 指示 克 立 金 法 适用 于 连续 型 和 离散 型 Z(x)。 

8 5 应 用 实例 

【 例 1 普通 克 立 金 法 应 用 。 

收集 了 塔里木 盆地 轮 南 凸 起 中 部 (图 12-12)48 口 井 的 压力 数据 ,在 结构 分 析 的 基础 上 ， 
对 其 中 15 口 井 的 压力 用 普通 克 立 金 法 进行 了 估计 ,并 与 实测 值 进 行 了 对 比 -交叉 验证 ( 表 
12-1, 据 康永 尚 )。 其 中 ,10 口 井 的 预测 精度 大 于 90% ,3 口 井 的 预测 精度 在 88 和 一 90 儿 之 
闻 ,2 口 井 的 预测 精度 在 86% 一 88% 之 间 ,结果 表明 , 克 立 金 法 预测 精度 能 满足 压力 预测 的 
要 求 。 

表 12-1 塔里木 盆地 轮 南 凸 起 中 部 超 压 压 力 系 统 普通 克 立 金 法 估计 值 与 实测 值 








预测 精度 稍 低 的 轮 南 51 并 和 解放 124 井 , 位 于 桑 塔 木 断裂 带 附 近 ( 图 12-12) 。 在 断裂 
带 附 近 , 地 层 的 孔 渗 性 得 到 改善 ,而 断裂 带 又 常常 是 泄 压 的 通道 , 故 在 断裂 带 附 近 压 力 分 布 
得 到 了 一 定 程 度 的 调整 。 本 方法 在 进行 压力 预测 时 ,所 能 考虑 的 是 地 层 压力 区 域 化 变量 在 
其 空间 域 中 的 整体 结构 性 状 ， 而 在 断裂 带 附近 地 层 压力 受 局 部 干扰 所 出 现 的 局 部 性 结构 特 
点 无 法 考虑 ,这 就 导致 本 方法 在 断裂 带 附 近 预 测 的 精度 要 低 一 些 。 
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图 12-12 塔里木 盆地 轮 南 凸 起 中 部 超 压 压 力 系 统 
实测 地 层 压 力 系 统 分 布 和 去 塔 木 断裂 位 置 示 意图 

【 例 2] 指示 克 立 金 法 应 用 ( 据 黄 竞 先 )。 

在 处 理 物化 探 数 据 时 ,常会 过 到 一 些 特异 值 ,所 谓 特异 值 是 指 那 些 比 全 部 数值 的 均值 高 
得 多 的 数值 ,这 种 数值 实际 存在 于 所 研究 的 母体 之 中 ,虽然 它们 只 占 全 部 数据 的 极 小 部 分 ， 
但 在 数值 估计 中 却 起 着 很 大 作用 ,它们 和 兹 使 数值 过 高 估计 。 此 外 ,在 区 域 找 矿 中 ,人 们 更 感 
兴趣 的 与 其 说 是 元 素 的 含量 ,还 不 如 说 是 大 于 某 一 指定 异常 下 限 的 概率 。 非 参数 地 质 统计 
学 一 一 指示 克 立 金 法 在 解决 特异 值 及 区 域 化 变量 的 概率 估计 上 是 有 效 的 。 

我 们 曾经 应 用 指示 克 立 金 法 处 理 福建 某 地 区 水 系 沉积 物 Mn 元 素 含量 数据 ,首先 根据 
样品 含量 的 累积 频率 分 布 图 ,分 别 求 出 0.1,0,.2,0.3,…,0.9 共 9 个 分 位 数 所 对 应 的 一 组 
下 限 值 C(X10-) 为 300,400,500,600,700,800,1 000,1 500 ,然后 根据 各 下 限 值 计算 半 变 异 
销 数 及 进行 指示 克 立 金 估计 ,绘制 了 展示 Mn 含量 的 指示 克 立 金立 体 图 (图 12-13) 和 克 立 
金 估 值 概率 等 值 线 图 (图 12-14)。 从 概率 等 值 线 图 上 可 以 清晰 地 看 出 区 域内 大 于 指定 下 限 
值 的 高 概率 的 地 段 分 布 位 置 。 
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图 12-14 Mn 含量 大 于 600X10 飞 的 概率 等 值 线 图 


思考 与 练习 


.如何 理解 随机 子 数 的 概念 ? 

. 什么 是 区 域 化 变量 和 它 的 二 重 性 ? 

. 何谓 平稳 假设 和 本 征 假 设 ? 两 者 有 何 区 别 ? 为 什么 要 做 这 种 假设 ? 
二 阶 平 稳 假 设 条 件 下 的 变 差 骂 数 有 何 性 质 和 功能 ? 

区 域 化 变量 有 何 地 质 特征 ? 

如 何 理解 几何 各 向 异性 和 带 状 各 向 异性 ? 

. 变 差 函数 有 哪些 基本 模型 ? 在 各 向 异性 条 件 下 如 何 进 行营 合 ? 
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8. 什么 是 克 立 金 法 ? 它 有 哪些 优 缺点 ? 

9. 为 何 说 克 立 金 法 是 一 种 线性 .无 偏 和 最 优 的 估计 ? 
10. 克 立 金 方程 组 有 什么 特点 ? 

11. 如 何 理解 克 立 金 方差 ? 

12， 指示 函数 的 物理 意义 是 什么 ? 

13， 指示 克 立 金 法 有 何 优点 ? 

14， 普通 克 立 金 法 与 指示 克 立 金 法 有 何 差异 ? 
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第 十 三 章 ” 人工 神经 网 络 及 其 应 用 
8$ 1 人工 神经 网 络 


一 、 人 工 神 经 网 络 概述 

长 期 以 来 人 类 一 直 试 图 了 解 和 揭示 人 脑 的 工作 机 理 和 思维 的 本 质 ,并 海 望 可 以 重新 构 
造 人 脑 ,这 个 目标 的 意义 不 言 而 喻 。 在 这 个 目标 的 驱使 下 ,20 世纪 40 年 代 问 世 的 电子 计算 
机 实现 了 人 类 利用 机 器 模拟 人 脑 逻 辑 思维 的 追求 。 现 在 计算 机 的 计算 速度 也 远 超 过 了 人 
脑 , 可 以 高 速 求 解 可 编程 问题 ,在 数值 计算 和 逻辑 运算 方面 扩展 了 人 脑 的 能 力 。 然 而 在 解决 
与 形象 思维 相关 的 问题 时 ,计算 机 却 显 得 无 能 为 力 。 比 如 欣赏 一 幅 画 ,人 脑 可 以 根据 直觉 和 
经 验 轻 松 地 做 到 ,而 对 计算 机 来 讲 却 相 当 艰 巨 。 

为 了 模拟 人 脑 的 形象 思维 ,人 工 神 经 网 络 应 运 而 生 。 膛 辑 思维 的 模拟 可 以 认为 是 从 心 
理 上 对 智能 进行 模拟 ,是 传统 的 人 工 智 能 技术 。 形 象 思维 的 模拟 是 从 生理 的 第 度 对 智能 进 
行 模 拟 , 是 基于 人 工 神经 网 络 的 人 工 智能 技术 。 为 叙述 简便 , 常 将 人 工 神 经 网 络 简 称 为 神经 
网 络 或 网 络 。 

1， 人 工 神 经 网 络 的 提出 

人 工 神 经 网 络 (artificial neural networks,ANN) 是 对 人 类 大 脑 系统 的 一 阶 特性 的 一 种 
描述 。 简 单 地 讲 , 它 是 一 个 数学 模型 ,可 以 用 电子 线路 来 实现 ,也 可 以 用 计算 机 程序 来 模拟 ， 
属于 人 工 智能 的 范畴 。 首 先 介绍 一 些 人 工 智 能 的 概念 。 

(1) 人 工 智能 。 

智能 是 个 体 认 识 客 观 事物 和 运用 知识 解决 问题 的 能 力 , 人 工 智 能 就 是 研究 如 何 让 计算 
机 模仿 人 脑 进行 工作 。 

人 工 智能 (artificial intelligence,AD 于 1956 年 问世 ,是 一 门 由 计算 机 科学 .控制 论 、 信 
息 论 . 博 言 学 .神经 生理 学 ,心理 学 .数学 .哲学 等 多 种 学 科 相 于 渗透 而 发 展 起 来 的 综合 性 新 
学 科 。 

对 于 人 工 智 能 的 研究 ,由 于 研究 角度 的 不 同 ,形成 了 不 同 的 研究 学 派 , 主 要 有 符号 主义 
学 派 .连接 主义 学 派 和 行为 主义 学 派 。 符 号 主义 又 称 为 逻辑 主义 、 心 理学 派 或 计算 机 学 派 ， 
其 原理 主要 为 物理 符号 系统 ( 即 符号 操作 系统 ) 假 设 和 有 限 合理 性 原理 。 连 接 主义 又 称 为 仿 
生 学 派 或 生理 学 派 , 其 主要 原理 为 神经 网 络 及 神经 网 络 间 的 连接 机 制 与 学 习 算法 。 行 为 主 
义 又 称 为 进化 主义 或 控制 论 学 派 , 其 原理 为 控制 论 及 感知 -动作 型 控制 系统 。 

(2) 人 工 神 经 网 络 的 提出 。 

人 工 神 经 网 络 源 于 人 类 对 人 脑 的 研究 。 人 类 对 自身 思维 的 好 奇 产 生 了 许多 关于 思维 的 
推测 ,直到 神经 解剖 学 家 和 神经 生理 学 家 提出 人 脑 的 “通信 连接 ”机 制 , 人 类 才 对 人 脑 有 了 较 
深刻 的 认识 。20 世纪 40 年 代 初 期 ,在 对 神经 元 的 功能 及 其 功能 模式 的 研究 取得 一 定 成 果 
后 ,研究 人 员 通 过 这 些 成 果 建 立 起 一 个 数学 模型 来 检验 他 们 的 猜想 ,这 标志 着 人 工 神 经 网 络 
的 出 现 。 
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1943 年 生理 学 家 McCulloch 和 数理 逻辑 学 家 Pitts 创立 了 阐 值 加 权 和 模型 ,; 即 MP 模 
型 ,开创 了 用 电子 装置 模仿 人 脑 结 构 和 功能 的 新 途径 。 这 种 模型 从 研究 神经 元 开始 ,进而 研 
究 神 经 网 络 模型 和 脑 模型 ,开辟 了 人 工 智能 的 又 一 发 展 道路 ,为 用 元 器 件 和 计算 机 程序 实现 
人 工 神经 网 络 莫 定 了 基础 。 

1949 年 心理 学 家 Hebb 发 表 了 《行为 构成 一 书 , 提 出 了 现在 称 为 Hebb 学 习 律 的 连接 
权 训 练 算法 。Hebb 也 是 最 早 提 出 “连接 主义 ”的 学 者 之 一 ,这 一 名 词 的 含义 是 大 脑 的 活动 
靠 脑 细胞 的 组 合 连 接 实 现 。Hebb 认为 如 果 源 神经 元 和 目的 神经 元 均 被 激活 ,它们 之 间 突 
触 的 连接 强度 就 会 增强 。 这 被 认为 是 最 早 最 著名 的 Hebb 学 习 律 的 生理 学 基础 。Hebb 学 
习 律 在 人 工 神经 网 络 的 发 展 史 上 具有 重要 地 位 ， 人 

2. 人 工 神经 网 络 的 历史 回顾 

20 世纪 50 年 代 到 60 年 代 末 期 ,人 工 神经 网 络 发 展 迎 来 了 第 一 次 高 潮 , 其 重要 成 果 是 
单 级 感知 器 及 其 电子 线路 模拟 。 单 级 感知 响 的 研究 成 功 , 使 人 们 过 于 乐观 地 认为 找到 了 秆 
能 的 关键 ,出 现 了 对 连接 主义 ,尤其 是 对 以 感知 器 为 代表 的 脑 模 型 的 研究 热潮 。 

由 于 受到 当时 的 理论 模型 .生物 原型 和 技术 条 件 的 限制 , 脑 模型 研究 在 20 世纪 70 年 代 

后 期 至 80 年 代 初 期 落 人 低潮 。 直 到 Hopfield 教授 在 1982 年 和 1984 年 发 表 两 篇 重要 论 

文 , 提 出 用 硬件 模拟 神经 网 络 以 后 ,连接 主义 才 又 重新 抬头 。1986 年 Rumelhart 等 人 提出 
多 层 网 络 中 的 反 向 传播 算法 (BP)。 此 后 ,连接 主义 势头 大 振 , 从 模型 到 算法 ,从 理论 分 析 到 
工程 实现 ,为 神经 网 络 计算 机 走向 市 场 打 下 了 基础 。 

20 世纪 90 年 代 后 ,人 们 发 现 人 工 神经 网 络 还 有 许多 没有 解决 的 问题 ,这 其 中 包括 许多 
理论 问题 ,人 工 神 经 网 络 进 人 再 认识 和 改进 现 有 模型 及 算法 的 应 用 研究 期 。 

二 、 人 工 神 经 网 络 基础 

人 工 神 经 网 络 源 于 对 生物 神经 网 络 的 研究 ,所 以 以 下 介绍 一 下 生物 神经 网 络 , 另 外 还 将 
介绍 人 工 神 经 网 络 的 基本 知识 ;人 工 神 经 元 模型 人工 神经 网 络 模型 和 人 工 神经 网 络 的 学 
习 。 

1. 生物 神经 网 络 

神经 系统 的 基本 构造 是 神经 元 (神经 细胞 ), 它 是 处 理 人 体内 各 部 分 之 间 相 互信 息 传递 
的 基本 单元 。 每 个 神经 元 都 由 一 个 细胞 体 ( 或 称 为 胞 体 ) .一 个 轴 罕 和 一 些 树 突 (或 称 为 枝 
营 ) 组 成 。 一 个 神经 元 的 神 旨 ON a ea ee he 
接 , 连 接点 称 为 突 触 , 突 触 是 神经 元 之 间 的 oD 
信息 输入 /输出 接口 ,信息 由 一 个 神经 元 的 
神经 末梢 通过 罕 触 传递 到 另 一 个 神经 元 的 细 
胞 体 或 树 突 ( 图 13-1) 。 

人 的 大 脑 中 约 有 10" 个 生物 神经 元 , 它 
们 通过 10* 个 连接 组 成 一 个 生物 神经 网 络 系 
统 。 

每 个 生物 神经 元 有 独立 接受 .处 理 和 传 
弟 电 化 学 信号 的 能 力 。 在 突 触 的 输入 端 , 神 
经 元 细胞 体 对 树 突 和 细胞 体 各 部 位 收 到 的 来 

自 其 他 神经 元 的 信号 进行 接收 和 组 合 ,这 些 3 生物 神经 元 示意 图 
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信号 可 以 起 到 刺激 或 抑制 的 作用 。 当 细 胞 体 受 到 的 刺激 累加 到 一 定 程度 后 ,细胞 体 就 被 激 
发 ,产生 一 个 输出 信号 。 输出 信号 沿 轴 突 传 到 末梢 , 轴 突 末梢 作为 输出 端 通过 突 触 将 信号 传 
给 其 他 神经 元 

在 生物 神经 网 络 系 统 中 ,每 个 神经 元 通过 突 触 与 其 他 很 多 神经 元 相连 接 , 接 收 来 目 其 他 
神经 元 的 不 同 信 号 ,并 向 其 他 神经 元 发 出 信和 号, 这些 由 同一 一 个 神经 元 发 出 的 信号 都 是 相间 
的 。 神 经 元 接收 到 的 信号 强 弱 取 决 于 它们 之 间 突 触 的 连接 强度 ,连接 强度 越 强 ,信和 号 就 越 
强 ,反之 越 弱 。 突 触 的 连接 强度 是 可 以 改变 的 。 

2. 人工 神经 元 结构 

从 模拟 生物 神经 网 络 的 角度 出 发 ,在 人 工 神经 网 络 中 模拟 生物 神经 元 的 是 人 工 神经 元 
artificial neuron,AN) ,其 地 位 相当 于 生物 神经 网 络 的 神经 元 。 人 工 神经 元 是 对 生物 神经 
元 的 抽象 , 它 对 生物 神经 元 的 结构 和 工作 机 制 进 行 模拟 。 

(1) 人 工 神经 元 模型 。 

1943 年 生理 学 家 McCulloch 和 数理 逻辑 学 家 Pitts 创立 的 立 值 加 权 和 模型 , 即 MP 模 
型 是 最 早 提出 也 是 影响 最 大 的 人 工 神经 元 模型 (图 13-2) 。 该 模型 基于 对 生物 神经 元 工作 
机 制 的 六 点 假设 ， 

@ 每 个 神经 元 都 是 一 个 多 输入 单 输出 的 独立 单元 ; 

@ 神经 元 接收 到 的 信号 有 刺激 和 抑制 两 种 类 型 之 分 ; 

@ 神经 元 具有 空间 整合 特性 和 立 值 特性 ， 

@ 信号 在 神经 元 之 间 的 传递 有 固定 的 时 延 ， 

不 考虑 信号 的 整合 作用 时 间 和 细胞 体 的 反应 时 间 ， 

© 突 触 强度 固定 。 

这 里 的 阅 值 特性 是 指 生物 神经 元 受到 的 刺激 累加 到 一 定 程度 才能 被 激发 。 第 六 条 假设 
是 不 符合 实际 情况 的 ,这 是 因为 受到 当时 认识 的 限制 。 

以 上 六 点 假设 是 对 生物 神经 元 工作 机 制 的 简化 和 抽象 。 通 过 这 些 假 设 , 可 以 对 生物 神 
经 元 的 工作 机 制 进行 形式 化 描述 。 





图 13-2 神经 元 模型 示意 图 
图 13-2 中 方 框 代表 神经 元 ANi zi，…z, 为 输入 信号 ,zi 代表 神经 元 AN; 传递 给 神 
经 元 AN; 的 信号 ;w; 代表 神经 元 AN; 与 神经 元 AN 的 连接 强度 , 称 为 加 权 系 数 或 权 系 数 
( 权 值 );o; 表示 神经 元 AN 的 输出 信和 号 。 
神经 元 AN 对 其 接收 到 的 所 有 信号 进行 整合 , 即 计算 输入 信号 的 加 权 和 。 然 后 神经 
AN 通过 激活 函数 了 对 整合 后 的 加 权 和 结果 进行 变换 ,以 确定 所 有 输入 信号 ee 
超过 了 神经 元 AN; 的 阔 值 ,如 果 超 过 了 国 什 ,该 神经 元 就 处 于 激发 状态 ,否则 处 于 抑制 状 
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态 。 神 经 元 状态 的 不 同 决定 了 输出 信号 0;。 

在 以 下 表述 中 ， 一 般 用 大 写 粗 体 字母 代表 向 量 ， 用 小 写字 母 代 表 其 中 一 个 元 素 , 比如 神 
经 元 AN, 的 输出 用 o 表示 ,神经 网 络 的 输出 用 O 表示 。 

如 果 令 向 量 闫 = (zi yzxi，… ,ZX,) ,向量 Wij 二 《wy ,wa zi) ,将 神经 元 AN 的 输入 
信号 的 加 权 和 表示 为 net; , 闭 么 


net; 一 XW, (13-1) 
神经 元 AN 的 输出 信号 为 : 
oj = flnet;) = f (XW,) (13-2) 
(2) 激活 瘟 数 。 
激活 函数 也 称 为 变换 函数 或 激励 函数 、 活 化 函数 。 激 活 项 数 通 过 控制 神经 元 的 输出 ,使 
神经 元 具有 不 同 的 信息 处 理 特 性 ,从 而 获得 更 广 的 适用 范围 。 最 为 常见 的 激活 函数 有 四 种 : 
阔 值 激活 函数 .线性 激活 函数 . 非 线性 激活 函数 、 概 率 激 活 函 数 。 
Q@ 阔 值 激活 函数 。 
阐 值 激活 函数 定义 为 : 
fnet) 一 全 由 (13-3) 
三 的 net < 日 
式 中 a,B,0 均 为 非 负 常数 ,9 为 国 值 。 通 常 a 取 1,8 取 0 或 一 1。 当 a=1 :0 一 0,0 一 0 时 称 为 
单 极 性 阔 值 激活 函数 ;: 当 a 二 1,8 二 1,0 一 0 时 称 为 双 极 性 彰 值 激活 函数 。 阅 值 激活 函数 如 图 
13-3 所 示 。 
四 线性 激活 函数 。 
线性 激活 函数 的 一 般 形式 为 : 
Jaet) = k,netto (13-4) 
式 中 率 ,6 均 为 常数 。 线 性 激活 函数 如 图 13-4 所 示 。 


及 me 





图 13-3 国 值 激活 函数 


图 13-4 线性 激活 函数 


非 线 性 激活 函数 。 
非 线 性 激活 函数 有 S 型 激活 函数 和 非 线性 斜面 激活 函数 。 
S 型 激活 函数 是 应 用 最 广泛 的 一 种 激活 函数 ,其 一 般 形 式 为 : 


二 
人 1 exp(— d »。 net) 3 


式 中 asb,d 均 为 常数 。 | 4 一 0,p 一 1,d 一 0 时 称 为 单 极 性 型 激活 画 数 ; 当 4 一 一 ,8 一 2， 
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4 一 0 时 称 为 双 极 性 S 型 激活 函数 。S 型 激活 陋 数 如 图 
13-5 所 示 。 
非 线 性 斜面 激活 函数 又 称 为 分 段 线 性 激活 聘 数 或 


伪 线 性 激活 函数 ,其 一 般 形 式 为 : 
C net 之 0 

fnet) ee —0<< net< 0 (13-6) 
= net <—0 





式 中 上 ,a,B 均 为 非 负 常数 。 当 a 二 1,p 二 0 时 称 为 单 极 性 

分 段 线性 激活 函数 ; 当 w 一 1,8=1 时 称 为 双 极 性 分 段 线 

性 激活 函数 。 非 线性 斜面 激活 函数 如 图 13-6 所 示 。 图 13-5 S 型 激活 函数 
@ 概率 激活 盟 数 。 





图 13-6 非 线性 斜面 激活 函数 
概率 激活 函数 的 输出 与 输入 没有 确定 的 关系 ,其 输出 一 般 为 1 或 0, 输出 为 1 的 概率 
为 ， 


1 


0 1 十 exp(— net/T) 


(13-7) 


式 中 TT 一 一 温度 参数 。 

3. 人 工 神 经 网 络 结构 

(1) 人 工 神经 网 络 的 基本 结构 。 

人 工 神 经 网 络 具 有 分 层 的 结构 。 一 般 来 讲 , 一 个 完整 的 人 工 神经 网 络 由 输入 层 .输出 层 
和 它们 之 间 的 隐藏 层 组 成 ,隐藏 层 可 以 有 多 层 , 也 可 以 没有 。 各 层 都 可 以 会 有 数量 不 等 的 神 
经 元 ,各 层 之 间 的 连接 方式 也 可 以 多 种 多 样 。 

对 于 某 个 层 内 的 一 个 神经 元 , 它 可 以 与 同一 层 内 的 其 他 神经 元 连接 , 称 为 侧 连接 ,也 可 
与 其 他 层 的 神经 元 连接 , 称 为 层 内 连接 ,甚至 可 以 与 它 自己 相连 ,这 样 就 可 以 使 每 次 的 输出 
相关 联 , 称 为 自 连 接 或 循环 连接 。 当 相互 连接 的 两 个 神经 元 传递 的 信号 起 刺激 作用 时 ,把 它 
们 的 连接 强度 表示 为 正 实数 ,否则 为 负 实 数 。 

图 13-7 是 两 个 神经 元 连接 的 模型 ,图 中 小 圆圈 表示 一 个 神经 元 ,箭头 表示 信息 传递 的 
方向 ,w; 表示 神经 元 AN; 和 AN 的 连接 强度 。 


wy 
AN (一 一 一 (AN 


图 13-7 神经 元 连接 模型 
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可 以 从 信号 传递 的 方向 来 考察 神经 网 络 中 各 层 的 关系 。 我 们 把 信号 在 同一 层 内 的 侧 问 
传递 称 为 横向 反馈 , 层 间 的 向 前 传递 称 为 层 前 反馈 (简称 前 馈 ), 层 间 的 向 后 传递 称 为 层 反 


馈 。 横 向 反馈 和 和 层 反 馈 统 称 为 反馈 ,如 图 13-8 所 示 。 
输出 层 
输出 层 





输入 层 隐藏 层 隐藏 层 
(a) 前 馈 神 经 网 络 结构 





输入 层 隐藏 层 隐藏 层 


ee 人 o) 
,| RZ .CZ 1 ., 
TS 六 
- A A A 
输入 层 隐藏 层 隐藏 层 输出 层 
(c) 层 反 馈 神 经 网 络 结构 


图 13-8 神经 网 络 的 基本 结构 

前 馈 神 经 网 络 结构 中 ,输入 层 接 收 输 入 信号 ,输出 层 输出 结果 ,其 他 相 邻 的 两 层 , 前 一 层 
的 输出 为 下 一 层 的 输入 。 任 何 介 于 输出 层 和 输入 层 之 间 的 层 都 称 为 隐 层 , 隐 层 的 有 无 或 多 
少 都 视 需 要 而 定 。 一 般 输入 层 只 是 起 到 将 接收 到 的 信息 扇 出 的 作用 。 任 意 相连 的 神经 元 之 
间 都 由 连接 强度 表示 它们 之 间 的 关系 。 

横向 反馈 神经 网 络 结构 中 , 侧 向 连接 的 层 可 以 是 任 一 层 ,也 可 以 有 多 个 侧 向 连接 层 ,其 
他 与 前 馈 神 经 网 络 结构 相同 。 / 

层 反 馈 神经 网 络 结构 中 ,向 后 传递 信号 的 层 一 般 是 输出 层 , 接 收 反 馈 信 号 的 层 一 般 是 输 
入 层 ,这 样 的 神经 网 络 称 为 循环 网 络 。 循 环 网 络 中 当前 的 输出 会 受到 上 次 输出 的 影响 ,而 上 
次 输出 受 上 次 输入 的 影响 ,这 样 就 形成 一 个 迭代 。 在 选 代 的 过 程 中 ,输入 的 原始 信号 被 逐渐 
加 强 和 修复 。 网 络 的 输出 可 能 每 次 都 不 相同 ,我 们 希望 通过 这 种 循环 使 得 网 络 输 出 的 信号 
趋 于 稳定 。 当 网 络 的 输出 符合 要 求 ,一 般 指 输出 无 变化 时 ,我 们 称 网 络 达到 了 平衡 ,循环 也 
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实际 的 神经 网 络 可 以 由 以 上 三 种 基本 结构 组 合 而 成 , 视 具 体 需 要 而 定 。 
(2) 激活 函数 。 | : 

人 工 神经 网 络 不 但 需要 结构 的 支撑 ,还 需要 激活 函数 来 处 理 信息 。 

假定 一 个 前 馈 神 经 网 络 有 nn 层 ,XX 是 输入 向 量 ,O.(l1 二 i 二 1) 为 第 i 层 的 输出 问 量 ,W' (1 
过 1 之 n) 为 第 i 层 到 其 后 一 层 的 连接 矩阵 ,NET,(1&i1 亿 n) 为 第 i 层 的 网 络 输入 巾 量 ,Fi(1<i 
过 n) 为 第 i 层 的 激活 晒 数 ,那么 

O; = F,(NET.,) = F,(XW’') 一 NET (1 过 i 过 nn) (13-8) 

网 络 最 终 的 输出 为 : 
O, 一 下 (FF CF, (CF CRWIOW DW ) (13-9) 

神经 网 络 每 一 层 的 激活 函数 都 可 以 不 同 , 但 如 果 全 部 都 是 线性 的 激活 函数 ,那么 可 以 证 
明 整 个 神经 网 络 的 功能 只 是 相当 于 一 个 只 有 输入 层 和 输出 层 的 简单 线性 前 馈 神经 网 络 。 所 
以 要 实现 复杂 一 些 的 功能 ,需要 使 用 非 线 性 激活 函数 。 

4， 人 工 神 经 网 络 的 学 习 

在 MP 模型 中 的 第 六 条 假设 是 “ 突 触 强 度 固定 ”, 这 与 模拟 人 和 脑 神经 网 络 的 目标 相 背 , 实 
际 上 生物 神经 元 可 以 通过 学 习 来 改变 它们 之 间 的 连接 强度 。 \ 

1949 年 心理 学 家 Hebb 提出 了 著名 的 Hebb 学 习 律 。Hebb 认为 如 果 源 神经 元 和 目的 
神经 元 均 被 激活 ,它们 之 间 突 触 的 连接 强度 就 会 增强 ,这 被 认为 是 最 早 最 著名 的 Hebb 学 习 
律 的 生理 学 基础 。 

人 工 神经 网 络 的 学 习 是 通过 训练 实现 的 ,即将 由 样本 回 量 构成 的 样本 集合 输入 到 人 工 
神经 网 络 中 ,然后 按照 一 定 的 规则 调整 神经 元 之 间 的 连接 权 , 从 而 使 神经 网 络 的 连接 权 和 矩阵 
存储 样本 集合 的 内 涵 , 这 就 是 神经 网 络 学 习 的 本 质 。 

(1) 学 习 的 形式 。 

从 形式 上 可 以 将 神经 网 络 的 学 习 分 为 有 导师 学 习 和 无 导师 学 习 。 

中 有 导师 学 习 。 

有 导师 学 习 又 称 为 有 监督 学 习 , 它 采用 纠 错 的 方式 实现 神经 网 络 的 学 习 过 程 。 有 导师 
学 习 不 但 要 求 给 出 输入 向 量 , 还 需要 给 出 相应 的 理想 输出 ,每 个 训练 样本 都 由 这 两 部 分 组 
成 。 神 经 网 络 将 其 实际 输出 与 理想 输出 相 比较 ,如 果 不 符合 要 求 ,神经 网 络 就 会 按 一 定 方式 
调整 连接 权 值 ,使 得 神经 网 络 的 输出 向 理想 输出 靠近 。 重 复 这 个 过 程 , 直 到 对 样本 集 来 说 神 
经 网 络 的 输出 达到 一 定 的 要 求 为 止 。 

有 导师 学 习 算法 常 采 用 Delta 规则 。Delta 规则 可 以 表示 为 : 

ws (t+ 1) = w(t) taly;— a;(t) lo;(t) (‘13-10) 
在 时 刻 i 十 1 和 + 或 第 上 十 1 次 和 第 i 次 训练 时 ,神经 元 AN; 到 
神经 元 AN, 的 连接 强度 ; 
o (四 一 一 神经 元 AN; 在 时 刻 上 的 输出 ; 
给 定 的 学 习 率 ， 
2 神经 元 AN; 的 理想 和 输出; 
a; (1) 一 一 t 时 刻 神经 元 AN 的 激活 状态 ,这 里 我 们 不 区 分 激活 状态 和 实际 输出 ,可 
以 认为 是 实际 输出 oj ; 
yi 一 Qj(f) 一 一 导师 因子 或 学 习 信 和 号。 





式 中 wi C(t 1) ,vw (t) 





ou 
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这 里 的 学 习 率 是 给 定 的 ,代表 了 神经 网 络 接受 新 信息 的 能 力 ,其 值 应 该 设置 在 合理 的 范 
围 内 ,如 果 太 大 ,网 络 很 难 收 倒 , 不 容易 趋 于 稳定 ;如 果 太 小 ,学 习 的 效率 不 明显 。 对 于 网 络 
输入 层 的 神经 元 ,它们 接收 的 信号 不 是 来 自 其 他 神经 元 ,而 是 输入 信号 ,这 时 式 (13-10) 中 的 
of(t 应 为 到 (人 电 。 

常见 的 有 导师 学 习 算 法 有 感知 器 学 习 算 法 、BP 算法 .最 小 均 方 学 习 算 法 、 相 关 学 习 算 法 
等 。 

@ 无 导师 学 习 。 

在 无 导师 学 习 中 ,用 来 训练 的 样本 只 有 输入 向量 。 网 络 通 过 训练 修改 连接 权 和 矩阵 ,以 使 
得 网 络 能 根据 网 络 的 内 部 结构 和 学 习 规则 ,在 输入 信息 中 发 现 可 能 存在 的 模式 和 规律 。 网 
络 根 据 其 功能 和 输入 信息 调整 权 值 ,这 个 过 程 称 为 网 络 的 自 组 织 。 

Hebb 学 习 算 法 是 一 种 著名 的 无 导师 学 习 算 法 ,这 种 算法 可 以 表示 为 : 
ws (t+ 1) = w(t) tao;(t)oi(t) (13-11) 
常见 的 无 导师 学 习 算法 有 Hebb 学 习 算 法 、 况 争 与 协 间 学 习 算 法 、 随 机 连接 算法 、 胜 者 
为 王 算法 等 。 
(2) 常见 学 习 算 法 举例 。 
1990 年 日 本 著名 神经 网 络 学 者 Amari 提出 了 一 种 神经 网 络 权 值 调整 的 通用 学 习 规 则 ， 
如 图 13-9 所 示 。 


A 形 


性 


图 13-9 权 值 调整 一 般 规 则 示意 图 
图 中 的 神经 元 AN; 是 网 络 中 的 某 个 节点 ;六 为 该 节点 输入 向 量 , 它 可 以 是 网 络 的 输入 ， 
也 可 以 是 其 他 节点 的 输出 ;ww; 为 第 i 个 输入 与 神经 元 AN; 的 连接 权 值 ,所 有 的 连接 权 值 构 
成 了 连接 和 矩阵 Wi; ,神经 元 AN; 的 阅 值 被 设 定 为 w , 且 输 入 分 量 z。 人 恒 为 一 1;6CW; , 闫 ,yj) 为 
生成 的 学 习 信号 ,或 称 为 导师 因子 , 它 是 实际 输出 o 与 理想 输出 y; 的 函数 ,而 oj 是 W, 与 XX 
的 函数 ,所 以 6 为 W;,XX,y; 的 函数 。 连 接 矩 阵 的 调整 量 AW, 与 6CW,;, 关 ,yy;)、 学 习 率 a、 输 
人 向 量 关 成正 比 。 用 数学 公式 表示 为 : 
Wi 十 1) = W(t) od W(t) ,X(t) ,y;)¥(L) (13-12) 
AW; = oad (CW; (1) ,X(t) ,yy;)X(H) (13-13) 
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式 中 的 4 CD) 即 可 以 是 来 自 网络 外 部 的 输入 ， 也 可 以 是 其 他 节点 的 输出 ,所 以 式 (13-10) 和 和 
(13-11) 都 是 式 (13-12) 的 特例 。 

对 于 无 导师 学 习 , 公 式 中 不 存在 理想 输出 项 y， 

学 习 信 号 6(W; ,XX,y;) 的 定义 不 同 ,形成 了 各 种 各 样 的 神经 网 络 学 习 规 则 ,下 面 简要 介 
绍 其 中 比较 基本 和 重要 的 ,对 于 其 他 更 多 更 详细 的 内 容 请 参考 其 他 资料 。 

QD Hebb 学 习 律 。 

前 面 已 经 多 次 提 到 过 Hebb 学 习 律 ,其 主要 内 容 为 当 连 接 的 两 个 神经 处 于 相同 状态 时 ， 
它们 之 间 的 连接 强度 应 当 增 强 ,如果 处 于 不 同 的 状态 ,连接 强度 应 当 减 弱 。 

在 Hebb 学 习 律 中 ,学 习 信号 等 于 神经 元 的 输出 , 即 

6 = f(XW,) (13-14) 
连接 矩阵 的 调整 向 量 为 : 
AW; = af (XW;)X (13-15) 

这 种 Hebb 学 习 律 代表 了 纯 前 馈 、 无 导师 学 习 。Hebb 学 习 律 要 求 权 值 有 初始 值 , 一 般 
取 零 附近 的 随机 小 数 。 为 防止 输入 与 输出 符号 始终 一 致 而 出 现 权 值 无 约束 增长 ,应 设 定 权 
值 的 饱和 值 。 

【 例 1】 设 有 四 输入 单 输出 神经 网 络 ,其 阅 值 为 0, 学习 率 a= 二 0.5。 样 本 向 量 半 = 
(1 一 1,1 ,一 1), 生 一 (1,0,1;0) ,到 一 (1, 一 1,0,0) ,初始 连接 矩阵 为 见 (0) 王 (0. 1,0, 一 0. 2， 
0. 3) ,使 用 双 极 性 阔 值 激活 函数 求 取 岁 (3) 。 

解 ;所谓 双 极 性 阅 值 激活 函数 ,是 当 net 大 于 阔 值 时 , f(net) 一 1; 当 met 小 于 等 于 阔 值 
时 ,Fnei 一 一 1 请 参考 阔 值 激活 函数 的 介绍 ) 。 

输入 第 一 个 样本 关 ,有 : 

netl = XIW(O0) = (1,—1,1,—1)(0.1,0,—0.2,0.3)' 一 一 0.4 

flnet' ) 一 一 1 

W(1)T = W(0)T + af (net' )¥X! 

= (0.1,0,—0.2,0.3) 二 0.5X(—1D)x(,—1,1,—1) 
= (—0.4,0.5,— 0.7,0.8) 

输入 第 二 个 样本 X: ,有 ， 

net’ = XW(1) = (1,0,1,0)(—0.4,0,.5,—0.7,0.8)7 一 一 1.1 

flnet’) =— 1 

W(2)7 = WO1)T + af (net’ )X:’ 

= (—0.4,0.5,C—0.7,0.8) 十 0.5X (一 1)X(,0,1,0) 
= (—0.9,0.5,—1.2,0.8) 

输入 第 三 个 样本 X ,有 : 

Met 一 KW(2) 一 (1 一 1;,0,0)( 一 0.9;0.5， 一 1.2,0.8)7 一 一 1.4 

fnet’) =— 1 

W(3)T = W(2)T + af (net’ DX 

一 〈 一 0.9,0.5, 一 1.2,0.8) 十 0.5X (一 1)Xx(1, 一 1,0,0) 
= (一 1.4,1.0, 一 1.2,0.8) 

@ 离散 感知 器 学 习 规 则 。 








感知 器 的 学 习 是 有 导师 学 习 。1958 年 美国 学 者 Frank Rosenblatt 提出 了 一 个 具有 单 
层 计 算 单元 的 神经 网 络 结构 , 称 为 感知 冀 。 实际 上 , 单 输出 的 感知 器 就 是 一 个 人 工 神 经 元 
(图 13-2) ,而 多 输出 的 感知 器 类 似 于 图 13-8 (a), 只 不 过 没有 中 间 的 隐藏 层 , 因 为 第 一 层 输 
和 人 层 只 是 起 到 扇 出 输入 信号 的 作用 ,所 以 仍 可 认为 是 一 种 单 层 的 神经 网 络 。 

感知 器 的 学 习 规则 是 学 习 信 和 号 等 于 神经 元 理想 输出 与 实际 输出 之 差 , 印 ,， 


$= y—o; (13-16) 
感知 器 采用 双 极 性 阅 值 激活 函数 ,连接 矩阵 的 调整 向 量 为 ; 
AW, = afy; — f (XW,)JX (13-17) 


式 中 y; 和 fC(XW,) 的 取 值 为 1 或 一 1。 

这 种 采用 阐 值 函数 作为 激活 函数 的 网 络 称 为 二 值 网 络 , 其 初始 权 值 可 取 任 意 值 。 

@ 连续 感知 器 学 习 规 则 。 

”如 果 把 感知 器 的 激活 函数 换 成 是 连续 可 导 的 项 数 ， 比如 S 型 激活 函数 ， 那么 就 称 为 连续 
感知 器 。1986 年 心理 学 家 McClelland 和 Rumelhart 在 神经 网 络 的 训练 中 引入 了 s 规则 ,该 
规则 规定 : 

6 = (Cy;—o0) fCXW;) = Ly; — f OXW,) fF (XW,) (13-18) 

这 时 的 学 习 信 号称 为 s。e 规则 保证 了 输出 值 与 理想 值 的 最 小 平方 误差 。 由 于 连续 感 
知 器 采用 连续 函数 作为 激活 函数 ,所 以 < 规则 可 以 推广 到 多 层 前 馈 网 络 , 初 始 权 值 可 取 任 意 
值 。 

三 、BP 神经 网 络 

BP 神经 网 络 是 目前 应 用 最 为 广泛 的 一 类 神经 网 络 ,我 们 将 介绍 最 基本 的 BP 算法 。 

在 上 面 提 到 的 感知 器 算法 中 ,理想 输出 与 实际 输出 之 差 被 用 来 估计 连接 权 值 的 误差 ,但 
并 没有 考虑 多 级 神经 网 络 中 隐藏 层 权 值 的 调整 ,因为 隐藏 层 的 神经 元 没有 理想 的 输出 ,难以 
估计 其 误差 。 

BP 神经 网 络 是 指 采用 BP 算法 的 神经 网 络 ,为 一 非 循环 多 级 网 络 。BP 算法 的 合 义 是 
误差 反 向 传播 (error back-propagation) ,正如 其 名 字 显 示 的 那样 , 它 利用 输出 层 的 误差 来 信 
计 输 出 层 的 直接 前 导 层 的 误差 ,再 用 这 个 误差 估计 更 前 一 层 的 误差 ,以 此 类 推 ,直到 得 到 所 
有 层 的 误差 。 

1. 网 络 的 构成 

BP 神经 网 络 是非 循 环 多 级 网 络 , 可 以 有 多 个 隐 层 。 由 于 增加 隐 层 层 数 和 隐 层 神经 元 个 
数 并 不 一 定 能 够 提高 神经 网 络 的 精度 和 功能 ,而 且 会 使 网 络 变 得 复杂 ,所 以 一 般 情况 下 BP 
神经 网 络 的 隐 层 只 有 一 层 。 

BP 算法 要 求 所 使 用 的 激活 函数 必须 是 处 处 可 导 的 ,一 般 使 用 S 型 激活 函数 。 假 设 一 个 
神经 元 的 输入 为 : 


net = ziwi 二 Xz 二 十 Tt; 
那么 其 输出 为 : 
本 二 
I 
o 对 于 net 的 导数 为 : 
f (net) = pe (t= 
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这 里 需要 注意 的 是 对 于 神经 元 的 输出 , 当 net 
落 在 (一 1,1) 之 间 时 ,o 变化 较 快 ; 当 net 落 在 (一 1,1) 
之 外 时 ,o 变化 较 慢 (图 13-10)。 所 以 当 网 络 训练 
时 需要 对 数据 进行 预 处 理 , 否 则 net 可 能 很 大 ,o 始 
终 为 1, 导 致 网 络 训练 失败 。 

2， 网络 的 训练 
BP 网 络 神经 的 训练 是 有 导师 训练 ,其 样本 集 

由 输入 向 量 和 理想 输出 向 量 构成 。 为 保证 网 络 训 
练 的 成 功 , 初 始 的 BP 网 络 神经 连接 权 值 应 该 是 一 
些 零 附近 的 随机 小 数 。 0 

BP 算法 分 为 四 个 步骤， 

@ 将 样本 集中 的 一 个 样本 (CX;,Y;) 输 入 网 络 。 

@@ 按 式 (13-9) 计 算 网 络 输出 O, 。 

得 到 理想 输出 Y; 与 实际 输出 O; 之 差 。 

@ 按 极 小 化 误差 的 方式 调整 权 和 矩阵 。 

这 个 过 程 将 一 直 循 环 下 去 ,直到 整个 样本 集 的 误差 满足 要 求 。 这 里 将 样本 (已 ,Y, ) 的 误 

差 定 义 为 ， 





> (ys 0 ) 

站 = 

式 中 ”7 一 一 理想 输出 向 量 中 元 素 的 个 数 , 即 理想 输出 的 个 数 ,也 就 是 说 对 于 一 个 输入 向 

量 , 它 对 应 的 输出 也 是 一 个 向 量 ,这 时 网 络 输出 层 的 神经 元 个 数 也 应 该 为 m。 
整个 样本 集 的 误差 为 : 


E; = (13-19) 


已 一 ZE (13-20) 
3. 误差 反 向 传播 和 权 值 调整 
假设 图 13-11 所 示 的 网 络 为 BP 网 络 的 一 部 分 ,第 & 一 2 层 和 上 一 1 层 的 其 他 神经 元 没 
有 表示 出 来 ,第 上 层 有 mm 个 神经 元 。 图 中 神经 元 AN; 与 AN 以 vj; 连接 ,神经 元 AN; 到 第 上 
层 的 连接 向 量 为 (zy zam)。6x-: 表 示 神 经 元 AN 的 输出 误差 ,6;_1 中 的 有 一 1 表示 
的 是 第 & 一 1 层 ,i 表示 的 是 第 ; 个 神经 元 ,同样 9 表示 第 & 层 的 第 1 个 神经 元 的 输出 误差 。 





第 -2 层 第 上 -1 层 第 k 层 


图 13-11 误差 反 向 传播 示意 图 
如 果 第 & 层 为 输出 层 ,根据 式 (13-12) 和 (13-13), 有 : 








五 油 获 字 地 项 Wy a 







Ar ， = od m0; (13-21) 
式 中 “一 一 第 上 层 中 的 某 个 神经 元 节点 。 
为 保证 了 输出 值 与 理想 值 的 最 小 平方 误差 ,根据 se 规则 ,由 式 (13-18) 得 : 


Bm = Fnetp)(yp 一 0p) (13-22) 
由 于 六 net) 二 o(1 一 0), 有 : 
Aruip = a0 m0) 
af (Cnets) (yp 一 0p )0j 
一 aoy(] 一 op)(Cyp — 0p)0; (13-23) 


如 果 第 & 层 不 是 输出 层 , 可 以 假定 其 为 输出 层 的 直接 前 导 层 , 以 此 类 推 ,可 以 假定 w， 
sa 已 经 调整 ,Bu ,644… ,6 已 知 ,如 果 可 以 表示 .4-1, 那 么 就 可 以 调整 整个 网 络 的 
任何 连接 矩阵 。BP 算法 认为 ,84 ,6a… ,6m 中 的 任何 一 个 都 有 G1.4-1 的 作用 ,61,:-! 是 与 Su， 
O24"* ,Gu 有 关 的 9 即 6 通过 权 wi 作用 于 Ol ;通过 权 wz 作用 于 O24 ， 以 此 类 推 ,通过 权 TU jm 
作用 于 6 。 因此 ,可 以 用 Yoi16 十 zu26x 十 … 十 WwimO mi 来 表 不 AN; 的 理想 输出 与 实际 输出 
之 间 的 差 , 根 据 式 (13-22), 有 : 

0j,4_1 一 fi net;) Cwnd tT wizdok 十 … 十 TimO mk ) (13-24) 

又 由 于 (net) 二 0(1 一 0), 有 : 

Av; 一 00j,410; 
= o0; (1 — 0;) (wn + wi 十 … + WimO me )0; 

虽然 BP 网 络 取得 了 巨大 的 成 功 ,但 是 它 的 一 些 问 题 也 是 非常 明显 的 ,比如 训练 速度 
慢 、 局 部 极 小 值 问题 .算法 收敛 问题 等 。 对 于 这 些 问题 的 解决 不 再 叙述 ,请 参考 其 他 资料 。 

四 、 神 经 网 络 在 石油 勘探 及 开发 中 的 应 用 简介 

由 于 神经 网 络 具 有 其 他 方法 无 法 比拟 的 优点 , 它 在 石油 勘探 及 开发 中 取得 了 广泛 的 应 
用 ,主要 有 以 下 几 点 : 

1]. 预测 渗 迁 率 

渗透 率 是 石油 地 质 勘探 及 开发 的 关键 参数 。 实 际 上 对 渗透 率 的 精确 预测 是 很 困难 的 。 
传统 的 方法 主要 是 进行 回归 分 析 , 通 过 建立 孔隙 度 和 渗透 率 的 相关 关系 式 , 用 和 孔 际 度 的 资料 
来 预测 渗透 率 。 用 这 种 方法 预测 的 结果 最 终 忽视 了 最 大 值 和 最 小 值 。 与 此 相反 ,神经 网 络 
系统 可 以 预测 渗透 率 的 精确 变化 ,所 用 资料 既 可 来 自 钻井 岩 芯 也 可 来 自 测 井 资料 。 

BP 网 络 对 预测 渗透 率 较为 有 效 。 首 先 使 用 孔隙 度 值 作为 输入 层 ,渗透 率 值 作为 输出 
层 。 这 里 须 指出 的 是 ,输出 层 要 包括 样品 的 位 置 及 计算 点 上 下 相 邻 的 几 十 个 孔 辽 度 值 ,最终 
仅 输出 一 个 沙 透 率 值 。 然 后 再 移动 所 要 计算 渗透 率 的 点 位 ,同样 输出 坐标 及 该 点 上 下 相 邻 
的 几 十 个 孔隙 度 值 , 然 后 再 输出 一 个 渗透 率 值 。 如 此 反复 , 便 可 得 出 孔 际 度 与 渗透 率 的 非 线 
性 对 应 关系 。 

2. 应 用 自 组 织 特征 映射 网 络 识别 储 技 

目前 石油 勘探 在 确定 储 层 及 测试 层 位 时 主要 依据 测 井 解释 。 由 于 测 井 啊 应 与 储 层 之 间 
的 关系 十 分 复杂 ,很 难 用 一 种 方程 表达 ,而 决定 储 层 产 油气 与 否 的 影响 因素 就 更 多 ,判断 就 
更 加 困难 。 究 其 原因 是 测 井 解释 模型 仍 未 摆脱 均 质 地 层 和 线性 方程 这 一 致命 的 不 可 靠 假 
设 , 以 致 解释 结果 不 能 令 人 满意 。 而 自 组 织 特 征 映射 神经 网 络 能 完成 输入 与 输出 之 间 复 杂 
的 非 线 性 映射 ,通过 对 简单 的 非 线 性 函数 进行 迭 合 , 便 可 实现 复杂 函数 关系 的 转换 ,加 上 神 


(13-25) 
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经 网 络 所 具有 的 完善 的 学 习 功 能 , 自 组 织 、 自 适应 及 联想 记忆 能 力 ,以 独特 的 信息 处 理 方 式 
为 利用 测 井 资料 预测 和 判断 储 层 的 智能 化 提供 了 一 个 新 的 方法 。 

采用 测 井 曲线 上 反映 储 层 的 特征 参数 训练 网 络 的 目的 ,在 于 对 未 知 样本 的 准确 预测 , 因 
为 学 习 样 本 的 正确 性 和 准确 性 直接 影响 着 预测 模型 的 可 靠 性 及 精度 。 针 对 测 井 处 理工 作 特 
点 , 特 选 定 与 储 层 物性 .油气 等 特征 密切 相关 , 且 在 测 井 曲线 上 容易 获取 的 电阻 率 、 孔 际 度 、 
渗透 率 、 泥 质 含量 .声波 .束缚 水 饱和 度 等 参数 ,并 依据 数值 大 小 分 级 ,按照 它们 反映 合 油 气 
储 层 的 贡献 强 弱 赋值 ,将 参数 进行 归 一 化 处 理 。 

已 知 样本 的 特征 参数 经 归 一 化 赋值 处 理 后 ,输入 自 组 织 特征 映射 网 络 进行 训练 学 习 和 
建 模 。 输 入 的 参数 没有 任何 规律 ,但 经 网 络 训 练 后 输出 的 各 特征 参数 所 代表 的 油层 .油水 
层 .水 层 . 干 层 在 平面 上 的 分 布 呈 局 部 集中 ,经 划分 区 间 后 界限 明显 。 自 组 织 特征 映射 网 络 
能 利用 从 测 井 曲线 上 提取 的 特征 参数 将 储 集 层 的 类 别 划 分 开 。 该 网 络 模型 还 可 以 利用 样本 
的 测试 结果 对 未 测试 层 段 的 产量 范围 进行 预测 。 

3. 自动 识别 岩 性 

利用 反 向 传播 算法 可 识别 岩 性 。 这 种 方法 对 测 井 解释 岩 性 较为 有 效 。 输 人 层 为 声波 时 
差 自然 电位 .电阻 率 及 自然 伽 玛 曲线 等 测 井 曲线 的 特征 值 ,输出 层 为 砂岩 .泥岩 及 厌 兰 等 的 
期 望 值 。 在 具体 计算 过 程 中 ,输入 层 及 隐藏 层 的 多 少 通常 任 经 验 获 得 ,并 没有 严格 的 规则 可 
循 。 

神经 网 络 经 训练 后 , 便 将 已 知 深度 的 测 井 曲线 赋予 相应 的 输入 神经 元 ,这 些 值 通过 网 络 
到 达 输 出 层 ,之 后 输出 层 就 能 识别 出 测 井 曲线 上 的 输入 值 代表 的 特定 知性 。 通 过 选取 宕 类 
及 输出 神经 元 , 便 可 识别 崖 性 。 

这 种 方法 优 于 传统 的 图 形 交 会 法 和 统计 法 ,具有 良好 的 识别 能 力 , 它 不 需要 像 统计 法 那 
样 复杂 精细 的 “ 预 处 理 ", 并 且 有 较 高 的 容错 性 ,方便 性 及 恨 好 的 适应 性 。 

4。 描述 油气 藏 非 均 质 性 | 

油气 藏 非 均 质 性 的 主要 参数 有 含油 气 岩 石 的 孔 除 度 .渗透 率 .油气 水 饱和 度 。 获 得 这 些 
参数 的 主要 途径 有 实验 室 测 定 . 测 井 解释 及 统计 方法 。 神 经 网 络 的 出 现 为 这 些 重 要 参数 的 
预测 提供 了 更 为 可 靠 的 途径 .在 实际 应 用 中 可 将 深度 . 伽 玛 射线 .体积 密度 及 深 感应 测 线 作 
为 神经 网 络 的 输入 。 通 过 网 络 的 训练 ,可 得 出 渗透 率 . 孔 阶 度 等 参数 的 预测 值 。 该 方法 能 够 
为 油 藏 模拟 提供 一 个 智能 前 端 , 它 为 地 球 物 理 测 井 的 进一步 利用 提供 了 新 的 思维 。 

5。 进 行 地 层 对 比 

地 层 对 比 对 研究 岩 性 、 岩 相 及 油气 横 回 连贯 等 研究 有 重要 的 意义 。 神 经 网 络 结合 有 序 
元 素 最 佳 匹 配 进行 地 层 对 比 , 可 以 克服 各 测 井 参数 值 的 不 规则 给 地 层 对 比 带 来 的 不 良 影响 ， 
并 可 简化 对 比方 法 ,降低 工作 量 , 从 而 达到 提高 地 层 对 比 的 精确 性 。 

这 里 须 指 出 的 是 ,在 地 层 对 比 过 程 中 ,可 将 神经 网 络 辐 经验 及 数学 地 质 的 其 他 方法 相 结 
合 ,进行 综合 对 比分 析 。 这 些 方法 包括 因子 分 析 .马尔 科 夫 链 、 最 优 分 割 法 . 聚 类 分 析 等 。 

6. 含油 气 有 利 性 综合 评价 

利用 人 工 神 经 网 络 进行 石油 勤 探 综合 评价 的 基本 原理 是 ,通过 若干 已 知 井 的 含油 气 特 
征 属 性 值 (学 习 样 本 ) 对 网 络 进行 学 习 训 练 , 使 其 获得 评价 专家 的 经 验 、 知 识 , 以 及 对 评价 
指标 的 倾向 性 认识 。 当 需要 对 未 知 井 进行 综合 评价 时 ， 网 络 将 再 现 专家 的 经 验 . 知识 和 直 
觉 思 维 ， 实现 定性 与 定量 的 有 效 结合 , 保证 评价 的 客观 性 和 一 致 性 。 
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7. 在 油田 开发 中 的 应 用 

石油 勘探 及 开发 的 最 终 目的 是 最 大 限度 地 提高 石油 采 收 率 。 运 用 人 工 神 经 网 络 “ 反 加 
传播 模型 ”的 改进 形式 ,将 影响 采 收 率 的 主要 因素 作为 系统 的 输入 ,通过 自学 习 算 法 ,人 研究 影 
响 采 收 率 的 诸 因 素 ,最 终 建立 油田 采 收 率 模型 ,能 较 好 地 描述 各 因素 间 的 复杂 非 线 性 关系 。 

8. 在 测 并 解释 中 的 应 用 

测 井 曲线 解释 主要 是 为 了 解决 以 下 两 个 问题 : _ 是 储 层 参数 的 选择 和 定量 计算 ,二 是 
识别 问题 ,， 如 油 ( 气 ) 水 识别 , 岩 和 性 识别 和 和 裂缝 识别 等 。 

长 期 以 来 ,传统 的 解释 方法 都 建立 在 线性 和 均 质 测 井 理论 基础 上 , 将 复杂 问题 进行 简 
化 假设 ,因而 建立 的 测 井 解释 模式 常常 与 实际 不 符 。 实 际 上 ,， 测 井 啊 应 与 地 层 特 性 之 加 的 
关系 是 十 分 复杂 的 , 很 难 用 一 种 方程 表达 出 来 。 而 神经 网 络 对 解决 这 类 问题 有 独特 的 优越 
性 ， 它 能 完成 输入 与 输出 之 间 复 杂 的 非 线 性 映射 。 通 过 对 简单 的 非 线性 函数 进行 几 次 复 
合 , 便 可 实现 复杂 双 数 关系 的 转换 ， 加 之 神经 网 络 具 有 较 完 善 的 学 习 功 能 、 自 适应 能 力 、 联 
想 记 忆 能 力 以 及 独特 的 信息 处 理 方式 等 ， 因 此 在 测 井 定量 解释 中 , 不 需要 事先 建立 任何 测 
井 响应 方程 或 提供 经 验 公 式 ， 也 避免 了 解释 过 程 中 一 些 中 间 参 数 选 择 .解释 模型 和 测 井 响 
应 方程 的 建立 以 及 求解 所 带 来 的 人 为 误差 ， 从 而 大 大 提高 了 测 井 解释 的 精度 和 速度 ， 为 测 
井 曲线 解释 开辟 了 一 条 新 途径 , 为 地 层 评 价 、. 地 层 结构 构造 及 沉积 环境 研究 .寻找 油气 储 层 
提供 了 可 靠 的 基础 数据 。 

“9. 在 地 震 勘 探 中 的 应 用 
由 于 神经 网 络 具 有 很 强 的 优 于 常规 模式 的 识别 能 力 , 它 能 通过 样本 进行 学 习 , 具 有 在 高 
音 干 扰 下 的 适应 性 ,并 能 大 量 减少 工作 量 。 因 此 , 它 已 被 广泛 用 于 地 震 勘 探 的 各 个 环节 
中 ,如 初始 波 自 动 收 取 , 地 震 道 自动 编辑 ,地 震 资 料 自动 解释 ,反射 层 自 动 追 踪 , 地 震 亮 点 或 
异常 振幅 的 自动 检测 ,地 震 谢 面 模式 识别 及 油气 预测 专家 系统 等 方面 。 
S 2 应 用 实例 

【 例 1] 采 用 BP 神经 网 络 对 川 东 大 天 池 构 造 石 炭 系 的 天 然 气 窗 集 程度 进行 横向 预测 。 
资料 来 自 该 构造 带 上 14 口 井 的 测 并 资料 ,选用 ?7 个 储 集 层 集 总 参数 作为 衡量 天 然 气 富 集 程 
度 的 特征 参数 :有 效 厚 度 .平均 孔 院 度 .平均 合 气 饱和 度 、 储 层 综合 判别 集 总 参数 .天然气 体 
积 集 总 参数 .基质 渗透 率 集 总 参数 . 裂 锋 总 孔隙 度 集 总 参数 。 选 取 天 东 26 井 等 共 11 口 并 的 
参数 作为 学 习 样 本 ,以 计算 的 单 井 储量 丰 度 作为 理想 输出 。 选 取 天 东 1 井 等 共 3 口 井 作为 
工作 目标 。 首 先 将 全 部 数据 进行 最 大 值 标准 化 ,然后 将 学 习 样 本 输入 网 络 进行 学 习 。 程 序 
在 进行 了 18 700 次 训练 后 达到 了 精度 要 求 , 即 样本 集 总 误差 小 于 0. 001。 将 预测 的 结果 进 
行 还 原 便 得 到 最 终 的 预测 值 。 

需要 说 明 的 是 由 于 初始 的 权 甜 阵 是 随机 的 ,隐藏 层 神经 元 个 数 也 可 以 不 同 ,所 以 训练 成 
功 需 要 的 次 数 会 有 变化 ,预测 的 结果 也 会 有 细微 不 同 。 为 得 到 尽量 准确 的 结果 ,训练 样本 应 
尽 可 能 准确 ,当然 大 前 提 是 选择 正确 的 特征 参数 。 

隐藏 层 神经 元 的 节点 数 一 般 取 2X (输入 层 节点 数 十 输出 层 节 点 数 ) 一 1, 本 例 中 为 15。 

数据 及 计算 结果 见 表 13-1。 
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表 13-1 大 天 池 构 造 石炭 系 天 然 气 富 集 横向 预测 


储 层 综合 
有 效 厚度 | 平均 孔 阶 | 下 均 售 | 判别 值 集 | 天 然 局 全 | 这 代 总 参 
Lm 度 /% 总 参数 | ys Cr 
/% CV 数 忆 CV | 数 志 CY 
39 6. 23 7 


83. 03 29 




















79, 66 





30 


70.9 


注 :“ 一 ”表示 训练 样本 。 


【 例 2] 在 回归 分 析 一 章 中 曾经 分 析 了 18 个 盆地 的 大 量 生 油门 跟 时 间 与 生 油层 温度 和 
埋藏 深度 之 间 的 关系 ,在 这 里 用 BP 神经 网 络 再 进行 一 次 分 析 。 

首先 对 数据 进行 最 大 值 标准 化 ,以 生 油层 温度 和 埋藏 深度 为 输入 信息 ,以 前 13 个 盆地 
的 生 油门 限时 间 为 理想 输出 ,进行 网 络 训 练 ,以 后 5 个 盆地 为 工作 目标 。 输 入 层 神经 元 节 点 
数 设 为 2, 输 出 层 节 点 数 设 为 1 ,隐藏 层 节点 数 设 为 5。 

经 过 训练 发 现 网 络 难以 收 伍 ,分 析 原 因 可 能 是 学 习 样 本 中 蕴含 的 规律 并 不 明显 或 有 利 
群 样本 。 经 过 分 析 发 现 网 络 样本 集 误 差 稳定 在 0.04 左右 , 故 将 误差 精度 设 为 0.04, 两 个 学 
习 率 都 设 为 0.2。 网 络 在 进行 了 约 95 000 次 训练 后 成 功 ,数据 和 工作 目标 预测 结果 见 表 13-2。 


表 13-2 神经 网 络 预 测 生 油门 限时 间 
盆地 名 称 人 埋藏 深度 生 油 门限 时 间 预测 生 油 门限 时 间 
| /CC /Am /Ma /Ma 
杜 阿拉 盆地 65 70 


1 200 
落 山 矶 盆地 

文 吐 拉 盆 地 
钙化 盆地 
阿 启 坦 盆地 (1) 
阿 局 坦 盆地 (2) 
卡 马 尔 圭 盆地 








2 440 






2 740 





1 400 






3 300 






2 500 





3 250 





石 汉 效 字 地 质 


















阿 尤 恩 盆 地 


9 苏 禄 海盆 地 

10 塔 拉 纳 基 盆 地 (1) 

11 亚马逊 盆地 

12 塔 近 纳 基 盆 地 {2》 

13 东营 凹陷 

14 潜 江 盆地 > 

15 松 辽 盆地 (1) 

16 松 辽 盆地 (2) 16 

17 松 辽 盆地 (3) 8 
辽河 盆地 人 


平均 误 关 IN 2 


注 :“ 一 "表示 训练 样本 


与 回归 分 析 相 比 ,可 以 发 现 神经 网 络 计算 结果 的 明显 不 同 ,这 是 由 它们 各 自 的 原理 所 决 
定 的 。 
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